2000年頃にヒトゲノムのドラフト配列が公開され、20年が経過し、ついに2022年にテロメアからテロメアまでをつなぐヒトゲノム完全参照配列が公開されました。その間、ヒトゲノム配列情報の測定機器の進展がめざましく、1つの測定機器で数千人以上のヒト全ゲノム情報を測定できる状況となりました。このようなヒトゲノム情報の測定機器の進展により、大規模コホート研究により国内外を合わせると60万人以上の規模のヒトのゲノムおよび生活習慣に関連するコホート情報を活用できるようになっています。
このような人個体のマクロな情報に加え、近年、1細胞レベルの時空間レベルでの測定機器などの進展により、ミクロなレベルの高精度大規模情報化もめざましく進展しています。
当分野では、このマクロとミクロな双方のレベルの大規模情報に対し、データサイエンスの技術基盤に基づき、クラウド基盤と融合した大規模電算資源を用いて、以下の3つの研究と人材育成を柱として推進をしていきます。
①大規模生命情報解析や最先端の計測機器の手法開発やソフトウェア実装に関連する研究
ライフサイエンスの分野で新しい測定機器と測定技術が開発されてきています。特に測定性能の向上により情報の大規模化、多次元化が進んできています。このような測定機器、測定技術に併せ、データサイエンスの技術を基盤とし、より適切な情報解析技術とソフトウェア実装の開発を進めていきます。
②コホート検体や臨床検体等バイオメディカル情報に手法を適用する研究
大規模コホート情報に加え、公共データベースに日々さまざまなゲノム情報やオミクス情報(トランスクリプトーム・メタボローム・プロテオーム等)が蓄積されてきています。これらの情報をインハウスで利用できるように整備統合することで、疾患研究へ活用を目的としたシステム構築を進めています。このシステムを用いることで、臨床の先生が課題としている疾患の理解において、多次元の尺度で比較、統合解析ができるようになり、疾患に関連する要素また原因の同定が加速します。また、各疾患の理解により適した情報解析技術開発を進めています。
③ヒトシステム生物学に関連する研究
長期的な目標として1や2の成果を通じ、生体内の現象をシステムとして理解するための研究を進めています。
④次世代の人材育成
この①から③の研究の中で、バイオメディカルの実践的な情報に研究メンバが日々触れることで、ヒトを中心としたゲノム、オミクス情報、また、臨床情報の大規模情報について情報解析を展開できる次世代かつ即戦力となるデータサイエンス時代の人材の育成を進めています。現在は、将来を見据えライフサイエンスへの量子計算活用にも取り組んでいます。
研究キーワード
Bioinformatics / 生命情報学
Population genetics / 集団遺伝学
Statistical genetics / 遺伝統計学
Human Genetic variation / ヒトゲノム多型
Huge scale data processing / 大規模データ処理
High performance sequencing / 次世代DNAシークエンス
Data-driven knowledge discovery / データ駆動型知識発見
Multi-omics approach / 多層オミクス解析
eQTL Analysis / 質的量的解析
Spatial Transcriptomics / 空間トランスクリプトミクス
Spatial Proteomics / 空間プロテオミクス
Preventive medicine / 予防医療
Quantum Computing / 量子計算
少し広いですので、いままで行ってきた・きている研究に関わる情報科学に関連するキーワードをあげますと、
Modeling / Petri net (モデリング / シミュレーション / ペトリネット)
Format / XML / Ontology / OWL (XML / オントロジー / オウル)
Data Structure and algorithm (データ構造とアルゴリズム)
Model Validation/ Model Checking/ Data Assimilation / Model Selection(モデル検証 / モデル検査 / データ同化 / モデル選択)
Database [データベース)
Optimization / Greedy Search / (最適化 / 貪欲法)
Visualization / Graph layout Algorithm (視覚化 / グラフレイアウト)
High performance computing / Cloud computing (ハイパフォーマンスコンピューティング / クラウドコンピューティング)
Software Development (ソフトウェア開発)
Bioinformatics, Systems Biologyに関連するキーワードだと
Metabolic Pathway / Signal Transduction Pathway / Gene Regulatory Network (代謝経路、シグナル伝達経路、遺伝子制御ネットワーク)
Biological Pathway Modeling and Simulation (生体パスウェイモデル&シミュレーション)
Gene Expression Analysis(遺伝子発現データ解析)
Pathway Database (パスウェイデータベース)
Pathway Layout Algorithm (生体内パスウェイのレイアウト)
Pathway Data Assimilation (生体内パスウェイモデルのデータ同化)
Pathway Model Validation and Checking (パスウェイモデルのモデル検証と検査)
HiT-seq pipeline development (シーケンスデータのパイプライン開発)
HiT-seq (DNA/RNA/Chip Sequence) Analysis (シーケンスデータ解析)
Long Read Sequencing (長鎖型シークエンサの解析)
IT技術に関係するキーワードだと
Java / Python / javascript / work flow engine / hybrid cloud comping / quantum computing
php / tomcat / singularity / appainer / eclipse / scala / quantum secure cloud
mysql / postgresql / slurm / lustre / deep learning / large language model (LLM)
のようなものが該当します。
また、以下の共同研究などの実績があります。
研究題目:妊婦の時系列でのオミクス、ゲノム情報と日々のライフログとの統合情報解析
研究期間:平成26年11月19日から平成31年3月31日
共同研究先:株式会社NTTドコモ
研究題目:インピューテーション技術・エスニックアレイ開発
研究期間:平成26年10月1日から平成29年3月31日
共同研究先:株式会社東芝
研究題目:量子計算技術を中心としたゲノム情報解析の応用に関する研究
研究期間:令和5年4月1日から
共同研究先:株式会社BlueMeme