AMED研究開発課題データベース 日本医療研究開発機構(AMED)の助成により行われた研究開発の課題や研究者を収録したデータベースです。

> 課題検索詳細

研究課題情報

研究課題名
頑健なデータ駆動形エピゲノム解析を実現する情報解析システムの構築
課題管理番号
23gm6310012h0004
統合プロジェクト
シーズ開発・研究基盤プロジェクト
事業名
革新的先端研究開発支援事業
タグ(2022)
/研究の性格/研究基盤及び創薬基盤の整備研究<創薬技術・ICT基盤・プラットフォーム関係含む>
/開発フェーズ/該当なし
/承認上の分類/薬機法分類非該当
/対象疾患/該当なし<対象とする疾患なし>
タグ(2021)
/研究の性格/研究基盤及び創薬基盤の整備研究<創薬技術・ICT基盤・プラットフォーム関係含む>
/開発フェーズ/基礎的
/承認上の分類/体外診断薬
/対象疾患/該当なし<対象とする疾患なし>
タグ(2020)
/研究の性格/研究基盤及び創薬基盤の整備研究<創薬技術・ICT基盤・プラットフォーム関係含む>
/開発フェーズ/基礎的
/承認上の分類/体外診断薬
/対象疾患/該当なし<対象とする疾患なし>
代表研究機関
国立大学法人東京大学
研究代表者
(2023) 中戸隆一郎 , 国立大学法人東京大学 , 定量生命科学研究所 准教授
(2022) 中戸隆一郎 , 国立大学法人東京大学 , 定量生命科学研究所 准教授
(2021) 中戸隆一郎 , 国立大学法人東京大学 , 定量生命科学研究所 講師
(2020) 中戸隆一郎 , 国立大学法人東京大学 , 定量生命科学研究所 講師
研究期間
2020年度-2023年度
課題への総配分額

(単位:千円)

  • 44,378
  • 2023年度
    最終金額確定後に配分額を表示します。
  • 2022年度
    18,898
  • 2021年度
    19,760
  • 2020年度
    5,720
研究概要(2023)
これまでに作成したパイプライン群(Churros: エピゲノム解析、RumBall: トランスクリプトーム解析、CustardPy: 立体構造解析、 ShortCake: シングルセル解析)を統合し、本研究で目標とするデータ統合解析パイプライン "Patisserie" を構築する。構築したシステムはDockerを用いて領域内外に公開する。構築したシステムを用いた領域内共同研究により、早期ライフステージに関する新規知見を獲得する。また我々独自の研究として、近年充実しつつあるシングルセルアトラスデータを活用した統合的情報解析による知見獲得を目指す。新規解析手法として開発している「深層学習を用いたクロマチン状態データ統合解析手法」を完成させ、論文化する。機械学習によるデータ補完技術を用いたエピゲノムデータ再構築手法について、得られた疑似データの信頼性評価の枠組みの確立を目指す。IHEC Integrative analysisワーキンググループに引き続き参加し、IHECデータパッケージ論文に貢献するための努力を続ける。
研究概要(2022)
複数サンプル・複数アッセイを同時入力とする全ゲノムアノテーション手法について、Docker、NextFlowを用いたエピゲノム解析パイプラインを実装し、領域内外に公開する。本課題のために作成したWebページ上に利用法や利用実績などの情報を公開し、共同研究の創発につなげる。新規解析手法として、複数のHi-Cデータを入力としたゲノムクラスタリング手法、深層学習を用いたクロマチン状態データ統合解析手法に本年度の目標を定め、手法の確立と論文化を目指す。システムの対象範囲をシングルセル解析にも拡張し、バルクデータとシングルセルデータの統合解析を可能とするシステムを目指す。機械学習によるデータ補完技術を用いたエピゲノムデータ再構築手法について、精度向上のためのアプローチ、及び得られた疑似データの信頼性評価の枠組みの確立を目指す。IHEC Integrative analysisワーキンググループに参加し、IHECデータパッケージ論文に貢献するため努力を続ける。領域内共同研究、及び早期ライフに関連する公開データを用いた統合解析を推進し、早期ライフステージのための知見獲得に貢献する。
研究概要(2021)
複数サンプル・複数アッセイを同時入力とする全ゲノムアノテーション手法について、Docker及びNextFlowを用いて、ヒト血管内皮エピゲノムプロジェクトで構築したエピゲノム解析手法を自動化したパイプラインを構築・公開する。これにより、利用者は統合解析の各ステップを構成する個々のプログラムの使用法について習熟することなくパイプライン全体を利用することが可能となり、統合解析のハードルを大きく下げ、他グループの円滑な大規模エピゲノム解析の推進に貢献できる。今後はこのパイプラインをベースに新規手法を追加するかたちでパイプラインを改良する。機械学習によるデータ補完技術を用いたエピゲノムデータ再構築手法の開発について、特任研究員を一名雇用のうえ、ChromImputeの精査を開始する。ここでも既に構築したヒト血管内皮エピゲノムデータベース、ROADMAP project及びEpimapで提供されている数百細胞種でのヒストン修飾ChIP-seqデータを用い、実データと疑似的に生成されたデータの比較を行いながら、ヒストン修飾ごとの品質について調査をすすめる。
研究概要(2020)
「複数サンプル・複数アッセイを同時入力とする全ゲノムアノテーション手法の開発」について、ヒト血管内皮エピゲノムプロジェクトのために既に構築したエピゲノム解析の枠組みを拡張するかたちで開発を開始する。初年度はまず、複数のHi-Cデータを入力としたゲノムクラスタリング手法について、手法の確立と論文化を目指す。また、連鎖不均衡ブロックを考慮したSNP-エピゲノム比較解析法についても調査をすすめる。「機械学習によるデータ補完技術を用いたエピゲノムデータ再構築手法の開発」について、特任研究員を一名雇用のうえ、ChromImputeの精査を開始する。ここでも既に構築したヒト血管内皮エピゲノムデータベース、及びROADMAP projectで生成された種々の細胞種でのヒストン修飾ChIP-seqデータを用い、実データと疑似的に生成されたデータの比較を行いながら、ヒストン修飾ごとの品質について調査をすすめる。

研究成果情報

【成果報告書】

成果の概要
複数サンプル・複数アッセイを同時入力とする全ゲノムアノテーション手法の開発
ゲノム立体構造情報を網羅的に得ることができるHi-Cデータから様々な1次元特徴量を抽出する新規手法 "HiC1Dmetrics" を開発した(https://h1d.readthedocs.io/en/latest/index.html)。本手法では第一主成分(A/Bコンパートメント解析に用いる)やインシュレーションスコア(TAD境界の同定)など従来から用いられている特徴量に加え、Stripe TAD、クロマチンハブ等の近年報告された特殊なゲノム立体構造を定量的に抽出・比較可能な新規手法を提案している。本手法をエピゲノム解析に応用し、種々のヒストン修飾と組み合わせた「クロマチン状態」を全ゲノム的に推定した結果、クロマチンループを伴うエンハンサーとそうでないエンハンサー、強い転写活性を持つTAD境界など、従来より詳細なクロマチン状態を網羅的に同定することができた [Wang and Nakato, 2021]。
機械学習によるデータ補完技術を用いたエピゲノムデータ再構築手法の開発
観測データが存在するデータに対してChIP-seqデータ補完法を用いて疑似データを生成し、観測データと比較することでデータ補完の精度を推定するパイロット実験を実施した。対象データとして我々が所有する9種のヒト血管内皮から得られたヒストン修飾データを用い、ROADMAP Projectにより公開されている117細胞種を学習データとして用いた。その結果、学習データの中にヒストン修飾パターンの類似した近縁細胞種が含まれるかどうかによって精度が大きく変わること、学習データ内に低品質データが存在する場合には精度が向上しないことなどが判明し、今後改善していくべき複数の課題が明らかになった。
共同研究創発による早期ライフステージエピゲノムに関する知見獲得
異分野間での活発な議論、交流、分野融合的な共同研究の創発につなげることを目標とした「マルチNGSオミクス解析研究会」を月1回開催し、システム構築と異分野融合的共同研究創発の足がかりとした(オンライン、全13回、詳細:https://amedprime-nakatolab.github.io/pages/Seminar.html)。
学会誌・雑誌等における論文一覧
  • ◀◀
  • 1
  • ▶▶

1.Machino H, Kaneko S, Komatsu M, Ikawa N, Asada K, Nakato R, Shozu K, Dozen A, Sone K, Yoshida H, Kato T, Oda K, Osuga Y, Fujii T, von Keudell G, Saloura V, Hamamoto R. The metabolic stress-activated checkpoint LKB1-MARK3 axis acts as a tumor suppressor in high-grade serous ovarian carcinoma, Communications biology, 5(1): 39-39, 2022. doi: 10.1038/s42003-021-02992-4.

2.Hada M, Miura H, Tanigawa A, Matoba S, Inoue K, Ogonuki N, Hirose M, Watanabe N, Nakato R, Fujiki K, Hasegawa A, Sakashita A, Okae H, Miura K, Shikata D, Arima T, Shirahige K, Hiratani I, Ogura A. Highly rigid H3.1/H3.2-H3K9me3 domains set a barrier for cell fate reprogramming in trophoblast stem cells, Genes & Development, 36(1-2): 84-102, 2022. doi: 10.1101/gad.348782.121.

3.Cona B, Hayashi T, Yamada A, Shimizu N, Yokota N, Nakato R, Shirahige K, Akiyama T. The splicing factor DHX38/PRP16 is required for ovarian clear cell carcinoma tumorigenesis, as revealed by a CRISPR-Cas9 screen FEBS, Open Bio, Online ahead of print, 2021. doi: 10.1002/2211-5463.13358.

4.Koui Y, Himeno M, Mori Y, Nakano, Saijou E, Tanimizu N, Kamiya Y, Anzai H, Maeda N, Wang L, Yamada T, Sakai Y, Nakato R, Miyajima A, Kido T. Development of human iPSC-derived quiescent hepatic stellate cell-like cells for drug discovery and in vitro disease modeling, Stem Cell Reports, 16(12): 3050-3063, 2021. doi:10.1016/j.stemcr.2021.11.002.

5.Wang J, Nakato R, HiC1Dmetrics: framework to extract various one-dimensional features from chromosome structure data, Briefing in Bioinformatics, 23(1): bbab509, 2021. doi: 10.1093/bib/bbab509.

6.Nakajima N, Hayashi T, Fujiki K, Shirahige K, Akiyama T, Akutsu T, Nakato R, Codependency and mutual exclusivity for gene community detection from sparse single-cell transcriptome data, Nucleic Acids Research, 49(18): e104, 2021. doi: 10.1093/nar/gkab601.

7.Nakajima N, Akutsu T, Nakato R, Databases for Protein-Protein Interactions, Methods in Molecular Biology, 2021(2361): 229-248, 2021. doi: 10.1007/978-1-0716-1641-3_14.

8.中戸隆一郎, Dockerプラットフォームを用いたシングルセル解析支援, 羊土社「実験医学」増刊号 Vol.39 No.12, 2021年7月, P1993-1999.

学会・シンポジウム等における口頭・ポスター
  • ◀◀
  • 1
  • ▶▶

1.中戸隆一郎,大規模マルチオミクスによるデータ駆動型ゲノム解析, AiT Web Seminar, 大阪大学(オンライン), 2022年1月14日, 国内, 口頭(招待講演).

国内 / 講演

2.Saijou E, Nakato R, Integrative study of hepatic fibrosis resolution mechanisms using single-cell RNA sequencing, 第44回日本分子生物学会年会, 横浜, 2021年12月2日, 国内, 口頭.

国内 / 口頭

3.Nagai H, Nagai E, Nakato R, Nakajima Y, Nutrient-dependent dedifferentiation of Drosophila enteroendocrine cells dissected by single cell analyses, 第44回日本分子生物学会年会, 横浜, 2021年12月2日, 国内, 口頭.

国内 / 口頭

4.Yamada T, Nakato R, Examination of practicality of data imputation for individual epigenomic dataset, 第44回日本分子生物学会年会, 横浜, 2021年12月2日, 国内, ポスター.

国内 / ポスター

5.Wang J, Nakato R, Pan-cancer analysis suggest conserved and changed cohesin bindings with oncogenic functions, 第44回日本分子生物学会年会, 横浜, 2021年12月2日, 国内, ポスター.

国内 / ポスター

6.中戸隆一郎,シングルセル発現量データを用いた遺伝子共発現ネットワークの構築と比較, 大阪大学医学系研究科第2回バイオインフォマティクスセミナー, 大阪大学(オンライン), 2021年10月19日, 国内, 口頭 (招待講演).

国内 / 講演

7.Nakajima N., Hayashi T., Fujiki K., Shirahige K., Akiyama T., Akutsu T., Nakato R., Codependency and mutual exclusivity for gene community detection from sparse single-cell transcriptome data, 第10回生命医薬情報学連合大会 (IIBMP2021), オンライン, 2021年9月28日, 国内, 口頭.

国内 / 口頭

8.大庭ジーナ未来、中戸隆一郎, Characterization of differentially expressed genes based on gene regulatory networks considering cell type-specificity, 第10回生命医薬情報学連合大会 (IIBMP2021), オンライン, 2021年9月28日, 国内, ポスター.

国内 / ポスター



更新日:2023-04-12

TOPへ