第47回インシリコ・メガバンク研究会開催のお知らせ(2月28 日)

第47回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は産業技術総合研究所 生命情報工学研究センター・David duVerle先生を講師としてお迎えし、「高次元データにおける遺伝子の組み合わせ相互作用の発見」について講演していただきます。

・日時:平成26年2月28 日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:Discovering Combinatorial Gene Interactions in High-Dimensional Data
・講師:David duVerle(産業技術総合研究所 生命情報工学研究センター)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

要旨:In the past decade or so, new technologies in biotech have meant an explosion in the availability of high-dimensional genomic data (microarrays, SNP data, RNA-Seq…): their dimension and noise levels making it necessary to rely on machine learning techniques and statistical models to extract meaningful signal and narrow down the field for further experimental research. In this presentation, I will try to give a very general overview of some of the statistical techniques commonly used to treat high-dimensional data, as well as a more detailed illustration of the technique we developed to identify combinatorial interaction effects in such data.
A crucial aspect of machine-learning when dealing with high-dimensional data, is the concept of sparsity: how much of the input’s variables find their way in the model. By using regularisation techniques (the addition of a tailored penalisation component), it is possible to ensure certain properties of the statistical model (size, elimination of collinear variables…). Another, is the fitting of complex statistical models that cannot be solved analytically, usually requiring optimising a non-linear objective function (e.g to maximise likelihood or minimise empirical error). While relatively simple in application, both techniques require some understanding of the underlying statistical assumption and information theoretic implications, in order to obtain satisfying results.
After giving a brief overview of regularisation techniques and their use in typical regression problems encountered in bioinformatics, I will introduce our recent work, which combines them with data-mining (itemset mining) and fractional programming techniques to fit complex statistical models over (non-linear) combinations of heterogeneous input variables, allowing for example to identify sets of genes (up- or down-regulated) that drive complex phenotypes or clinical observations.
This work was in particular successfully applied to a combination of cDNA microarray and gene mutation copy number data paired with (right-censored) survival data, to identify interactions (and potential synthetic lethals) playing a role in neuroblastoma and breast-cancer.

・世話人: 長崎正朗

第45回インシリコ・メガバンク研究会開催のお知らせ(2月18日)

第45回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。今回は国立遺伝学研究所 斎藤成也先生を講師としてお迎えし、「日本列島人のDNA進化:その過去と現在」について講演していただきます。

・日時:平成26年2月18日(火) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:日本列島人のDNA進化:その過去と現在
・講師:斎藤成也(国立遺伝学研究所)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

概要:日本列島人の成り立ちについて、縄文時代から住んでいた「縄文系」と,弥生時代以降の「渡来系」の二つに考えて説明した考え方を「二重構造モデル」と呼ぶ。このモデルによれば、まず東南アジアに住んでいた古いタイプのアジア人集団の子孫が、旧石器時代に最初に日本列島に移住して、縄文人を形成した。その後弥生時代に移るころに,北東アジアからの移住があった。彼らはもともとは縄文人と同じ祖先集団から誕生し、その後独自の変化をして、顔などの形態が縄文人とは異なってきた。これら大陸からの渡来人は,先住民である縄文人の子孫と混血をくりかえした。ところが北海道にいた縄文人の子孫集団は渡来人との混血をほとんど経ず,アイヌ人集団につながっていった。沖縄を中心とする南西諸島の集団も,本土から多くの移住があったが,日本列島本土に比べると縄文人の特徴をより強く残した。以上のモデルは、おもに埴原和郎ら人骨データを解析した研究者が提唱したものだが、その後のゲノム規模SNPデータの解析結果も、この二重構造モデルを概略支持している。一方、古代人のDNAを直接調べる研究は、これまでミトコンドリアDNAが中心だったが、最近私の研究室と国立科学博物館を中心とした解析チームが、東北地方の複数の縄文貝塚遺跡から出土した人骨にのこっていたゲノムDNAの一部分を決定することに成功した。これらの結果は、縄文時代人が東ユーラシアの中できわめて特殊な集団だったことを明確にしめしている。今回の講演では、これらの、日本列島に過去から現在まで居住してきた人々のゲノムDNAの進化について、最新の成果を含めてお話しする。

・世話人:河合洋介、長崎正朗

 

第46回インシリコ・メガバンク研究会開催のお知らせ(2月21日)

第46回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。

今回は産業技術総合研究所 生命情報工学研究センター・Martin Frith先生を講師としてお迎えし、「元来の統計的アライメントにおける最新高スループットDNAの適応」について講演していただきます。

・日時:平成26年2月21日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:Adapting classic statistical alignment to modern high-throughput DNA
・講師:Martin Frith(産業技術総合研究所 生命情報工学研究センター)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

For many decades, the main way of analyzing biological sequences has been by comparing and aligning them.  This remains true today.  Modern tasks include: comparing whole genomes; aligning bisulfite-converted DNA reads to a genome; aligning long, high-error sequences from single molecule sequencers; aligning ancient or degraded DNA; comparing metagenomic DNA to a protein database. Over the decades, statistically powerful alignment techniques have been developed, including: log likelihood ratio scoring matrices, pair hidden Markov models, and probabilistic alignment.  Unfortunately, these methods are rarely used with modern deep sequencing data, This talk will also sketch how to incorporate some new features into classic statistical alignment: sequence quality data (phred scores); pairing relationships between DNA reads; and split alignment, where different parts of one query sequence may align to disjoint loci in a genome.  This is useful for genome rearrangements, spliced RNA splicing), and even whole genome comparison.  The statistical approach can tell us the reliability (unambiguity) of any part of an alignment.

・世話人: 長﨑正朗

第44 回インシリコ・メガバンク研究会開催のお知らせ(1月17日)

第44回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は東京大学大学院農学生命科学研究科・新村芳人先生を講師としてお迎えし、「脊椎動物嗅覚受容体遺伝子の進化 〜環境に応じて変化するゲノム〜」というタイトルで講演していただきます。

・日時:平成26年1月17日(金) 16:00‐17:30
・場所:医学部1号館2階 中会議室
・演題:脊椎動物嗅覚受容体遺伝子の進化 〜環境に応じて変化するゲノム〜
・講師:新村芳人(東京大学大学院農学生命科学研究科)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

概要:環境中の多様な匂い分子は、嗅覚受容体(olfactory receptor, OR)によって検出される。OR遺伝子は哺乳類で最大の遺伝子ファミリーを形成し、その数はヒトで約400個、マウスやラットでは1,000個以上におよぶ。OR遺伝子ファミリーは、種によって遺伝子数が大きく異なること、進化過程での重複や欠失が極めて多いことによって特徴づけられる。また、個々のOR遺伝子ごとに進化ダイナミクスが異なり、多くの子孫を生み出す遺伝子が存在する反面、重複や欠失がなく進化的に安定しているような遺伝子はほとんど存在しないことも明らかになった。本講演では、脊椎動物OR遺伝子ファミリーの進化に着目して、匂いという感覚の不思議に迫ってみたい。

世話人:黒木陽子、長﨑正朗

第43 回インシリコ・メガバンク研究会開催のお知らせ(12月20日)

第43回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。今回はYale大学・田中義章先生を講師としてお迎えし、「患者由来iPS細胞をもちいたレット症候群トランスクリプトーム解析」について講演していただきます。

・日時:平成25年12月20日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:患者由来iPS細胞をもちいたレット症候群トランスクリプトーム解析
・講師:田中義章(Yale University)

概要: レット症候群(RTT)は女児特異的におこる神経発達障害のひとつであり、生後6-18カ月内に言語障害や運動障害などの症状を示す。レット症候群患者の90%以上はメチル化DNA結合タンパク質のMeCP2に変異を持つ。MeCP2はX染色体上に存在するためX染色体不活性化の影響を受ける。またMeCP2は生存上重要な遺伝子であるため、レット症候群患者は片方のX染色体のみにMeCP2の変異を持つ。これまでにMeCP2欠損マウスやヒト死後脳からRTTに関するさまざまな知見が得られてきたが、レット症候群の早期発達期における疾患メカニズムはまだ十分に理解されていない。近年、我々はレット症候群患者の繊維芽細胞よりiPS細胞(RTT-iPS細胞)を作製し、野生型MeCP2を発現するRTT-wt-iPS細胞クローンと変異型MeCP2を発現するRTT-mu-iPS細胞クローンを単離した。またiPS細胞作製時に、X染色体の再活性化を示すクローンが観察され、野生型と変異型の両方を発現するRTT-bi-iPS細胞も同時に単離した。本研究ではMeCP2の多能性幹細胞における影響を調べるために、これらのRTT-iPS細胞クローンを利用しトランスクリプトーム解析を行った。その結果、スプライシングや細胞周期関連遺伝子などこれまでMeCP2が関与すると報告されていたものに加え、ミトコンドリア関連遺伝子がRTT-mu-iPS細胞において過剰発現をしていることを発見した。またミトコンドリア遺伝子の過剰発現は神経分化後や死後脳でも観察された。さらにRTT-bi-iPS細胞を利用してMeCP2のX染色体における影響も明らかにした。これらの結果は早期発達におけるMeCP2変異が与える影響の理解や新しい治療ターゲットとして重要である。

世話人:山下理宇、長﨑正朗

 

第42 回インシリコ・メガバンク研究会開催のお知らせ(12月13日)

第42回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は国立遺伝学研究所・野澤昌文先生を講師としてお迎えし、「種間比較から遺伝子量補償機構の進化を探る」というタイトルで講演していただきます。

・日時:平成25年12月13日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:種間比較から遺伝子量補償機構の進化を探る
・講師:野澤昌文(国立遺伝学研究所 生命情報研究センター)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

概要:性染色体の進化は、一対の常染色体に性決定遺伝子や性拮抗遺伝子が集まることから始まる。性を維持するためにはこれらの遺伝子は連鎖している必要があり、X‐Y染色体間の組換えは抑制される。それに伴い、Y染色体には自然選択が作用しにくくなるため、突然変異や転移因子が蓄積し、Y染色体の多くの遺伝子がその機能を失う。その結果、オスにはX染色体上の遺伝子が1コピーしかなくなるため、雌雄間および染色体間で遺伝子量の不均衡が生じる。この不均衡は異型性染色体が進化する上で選択的に不利であると考えられるので、この不均衡を解消する分子機構として「遺伝子量補償」という概念が提唱された。実際、多くの研究からヒトをはじめとする多くの生物でその存在が示唆されている。しかし、これらの結論の多くは遺伝子発現量が雌雄間や染色体間で等しいという結果に基づいており、性染色体の進化過程を考慮した形での議論はほとんどなされていない。そこで私は、最近性染色体が生じたウスグロショウジョウバエのX染色体とその近縁種の相同常染色体の遺伝子発現を比較することで、遺伝子量補償の進化過程を探ろうと試みている。本発表では、これまでに得られた知見を紹介するとともに、今後の展望についても述べてみたい。

世話人:佐藤行人、長﨑正朗

第41 回インシリコ・メガバンク研究会開催のお知らせ(12月10日)

第41回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は統計数理研究所・西山悠先生を講師としてお迎えし、「最近のカーネル法として正定値カーネルを使ったベイズ推論の話題」について講演していただきます。

・日時:平成25年12月10日(火) 17:00‐18:30
・場所:医学部1号館2階 中会議室
・演題:最近のカーネル法として正定値カーネルを使ったベイズ推論の話題
・講師:西山悠(統計数理研究所)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

概要:近年のカーネル法では、正定値カーネルを使ったベイズ推論(カーネルベイズ推論)が研究されている。この方法論は、確率分布の代わりに確率分布を一意に定めるようなカーネル平均を推論していくものである。カーネル平均は,確率分布の通常の平均ではなく、特徴空間での平均で定義される。周辺化操作に使われる「和公式(sum rule)」や、ベイズ事後分布を求める「ベイズ則(Bayes’ rule)」について、いずれもカーネル化された「カーネル和公式」、「カーネルベイズ則」を紹介する。これらを組み合わせて、状態空間モデルのフィルタリングや強化学習アルゴリズムが導かれる。最近発表者らが行っている確率モデルを組み合わせたカーネルベイズ推論についても紹介する。

世話人:小島要、長﨑正朗

 

第40 回インシリコ・メガバンク研究会開催のお知らせ(12月6日)

第40回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。今回は統計数理研究所・小森理先生を講師としてお迎えし、「一般化t統計量の漸近的性質の考察とその実データ解析への応用」について講演していただきます。

・日時:平成25年12月6日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:一般化t統計量の漸近的性質の考察とその実データ解析への応用
・講師:小森理(統計数理研究所)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

概要:高次元データの解析において臨床医療またはさまざまな病気の診断に有効な変量(マーカー)の探索は近年ますます重要になってきている。遺伝子発現量のデータのような高次元の連続量のデータ解析においては、t統計量やc統計量(AUC)などが変数絞り込みの段階でしばしば用いられる。今回我々はこの検定統計量の一つであるt統計量に着目し、単変量ではなく多変量の線形結合を考えることでこのt統計量を判別問題に応用することを考える。t統計量に対し生成関数であるU関数を考えることにより、さまざまなt統計量の一般化が考察できる。 一つの結果としてt統計量、c統計量(AUC)、Fisher線形判別、Kullback-Leibler divergenceとの密接な関係が明らかになった。またこの手法の実データへの応用例として一般化t統計量にL1ペナルティをつけたLassoタイプの手法を提案する。この手法の一つの特徴として、あらかじめ有用であることが分かっている変量(発症リスクに関連が深い変量)を固定したうえでその他の変数の選択ができる点があげられる。シミュレーションと実データ解析においてその有用性を検証する。また将来的にはSNPのような離散的なデータに対しても適用可能な統計的手法を考えて行きたい。

世話人:田宮元、長﨑正朗

第39 回インシリコ・メガバンク研究会開催のお知らせ(11月15日)

第39回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は筑波大学・大橋順先生を講師としてお迎えし、「HLA遺伝子領域の特殊性とHLA関連解析」について講演していただきます。

・日時:平成25年11月15日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

概要:HLA(ヒト白血球抗;Human Leukocyte Antigen)の主な機能は、T細胞への自己および非自己(病原体)由来の抗原を提示することである。古典的HLA分子にはクラスI分子とクラスII分子があり、それらHLA分子をコードするHLA遺伝子群は、第6染色体の短腕部6p21.3に位置している。HLA遺伝子領域の特徴として、ヒトゲノムの中で最も高度な多型性をしめすこと、数Mbにおよぶ強い連鎖不平衡が観察されること、ハプロタイプによって遺伝子数に違いがあること、様々な疾患に対する感受性と関連する多型が存在すること、などが挙げられる。本発表では、HLA遺伝子領域の連鎖不平衡を理解するうえで重要な自然選択の役割について、日本人集団でDPB1*04:01アリルに最近作用した正の自然選択を例に解説する。また、私どもが熱帯熱マラリア患者を対象に行ってきたHLA遺伝子の関連研究についても紹介したい。

世話人:田宮元、長﨑正朗

第38回インシリコ・メガバンク研究会開催のお知らせ(11月8日)

第38回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は科学技術振興機構・川嶋実苗先生を講師としてお迎えし、「NBDCヒトデータベース:ヒトデータ共有ガイドラインとヒトデータ提供・利用申請の紹介」というタイトルで講演していただきます。

・日時:平成25年11月8日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:NBDCヒトデータベース:ヒトデータ共有ガイドラインとヒトデータ提供・利用申請の紹介 ・講師:川嶋実苗(科学技術振興機構・バイオサイエンスデータベースセンター)

要旨:ヒトに関して取得される生命科学データは、次世代シークエンサーデータや画像データをはじめ、解析技術の発達に伴って膨大な量になりつつある。それらを整理・格納して、生命科学の進展のために有効に活用するためのルールや仕組みが必要である。独立行政法人科学技術振興機構(JST)バイオサイエンスデータベースセンター(NBDC)では、個人情報の保護に配慮しつつ、ヒトに関するデータの共有や利用を推進するためにヒトデータに関する様々なデータベース等を共有するためのプラットフォーム『NBDCヒトデータベース』を設立するとともに、国立遺伝学研究所 DNA Data Bank of Japan (DDBJ)と協力してヒトに関するデータの公開を進めている。また、その運用ルールとしての『NBDCヒトデータ共有ガイドライン』および『NBDCヒトデータ取扱いセキュリティガイドライン』を策定し公開した。
共有ガイドラインを遵守してデータ共有を行なう上でのポイント、および、データ提供申請や利用申請における必要書類と具体的な申請方法について紹介する。

世話人: 田宮 元、長﨑 正朗