第48 回インシリコ・メガバンク研究会開催のお知らせ(7月11日)

第48回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は東北大学生命科学研究科・牧野能士先生を講師としてお迎えし、「重複遺伝子の進化学的研究と生態学・医学分野への応用」について講演していただきます。

・日時:平成26年7月11日(金) 17:00‐18:30
・場所:東北メディカルメガバンク棟3階 小会議室2 http://www.megabank.tohoku.ac.jp/access/access01
・演題:重複遺伝子の進化学的研究と生態学・医学分野への応用
・講師:牧野能士(東北大学大学院生命科学研究科)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

・概要:遺伝子がコピーされる突然変異である遺伝子重複は、主として新規機能を持った遺伝子の創出メカニズムとして着目されてきた。遺伝子重複により機能が分化した遺伝子が増加すれば、環境から受ける様々な撹乱に対するロバストネスは高まる事が予想される。我々は、哺乳類やショウジョウバエ属のゲノム情報既知種に着目し、ゲノム中に含まれる重複遺伝子の割合が高いほど、生息する環境が多様性であることを見出した。ゲノム中の重複遺伝子を調べることで種の環境変化に対する脆弱性や侵略性を測ることが可能になれば、全く新しいアプローチによる外来種問題や生物保全への取り組みが期待できる。また、個々の遺伝子の重複ではなく進化過程において希に全ての遺伝子が倍加する全ゲノム重複が起こることがある。全ゲノム重複は生命システムのロバストネスを飛躍的に高め、絶滅の回避や種子植物・脊椎動物の成立などの大進化に寄与してきた。一方で、全ゲノム重複後に消失せず保持された重複遺伝子(オオノログ)はロバストネスには寄与せず、他の重複遺伝子と区別する必要がある。それどころか、オオノログは疾患に関わる傾向が強い。オオノログが持つ特殊な性質である遺伝子量均衡性について概説し、オオノログが疾患関連遺伝子である具体例を紹介する。

・世話人:佐藤行人、長﨑正朗

 

医療ビッグデータ・サミット2014にて講演 : 長﨑教授 (7月7日)

長﨑正朗教授が7/7に医療ビッグデータ・サミット2014にて講演を行いますのでお知らせ致します。

日時:7月7日(月) 12:55 – 13:45
【地域の取り組み】医療情報と遺伝情報を集積して個別化医療を実現

場所 : ソラシティカンファレンスセンター(東京・御茶ノ水)
講師:長﨑正朗

詳しくは下記のリンクをご参照下さい。
http://techon.nikkeibp.co.jp/article/SEMINAR/20140515/352080/

長﨑研:研究室住所変更のお知らせ

長﨑研究室が加齢医学研究所より、
東北メディカル・メガバンク棟へ移設いたしました。
新住所は下記になります。

〒980-8573
仙台市青葉区星陵町2-1
東北メディカル・メガバンク棟4F
東北大学 東北メディカル・メガバンク機構 ゲノム解析部門
バイオメディカル情報解析分野
長﨑研究室

アクセスについてはリンクをご参照下さい。
http://nagasakilab.csml.org/ja/access-2

DSC_0035

九州大学にて講演 : 長﨑教授, 成相助教 (3月18日)

長﨑正朗教授、成相直樹助教が3/18に九州大学馬出キャンパスにて講演を行いましたのでお知らせ致します。

日時:3月18日(火)
「よく分かる次世代シークエンサー解析~最先端トランスクリプトーム解析~」

場所 : 九州大学馬出キャンパス コラボステーションⅠ 共同セミナー室A・B 総合研究棟 ITルーム
講師:長﨑正朗、成相直樹

13:00~13:30 セミナー「日本人1000人の全ゲノムの解析の現状と課題」

場所:コラボステーションⅠ 共同セミナー室A・B
講師:長﨑正朗
東北大学東北メディカル・メガバンク機構では2013年11月29日に1000人ゲノムのシークエンスが完了した。本セミナーではヒトの全ゲノム解析の現状と見えてきている課題、現在得られている変異コールの精度,データの公開などを含め時間の取れる範囲で話を行う。

13:30~14:00 セミナー「RNA-Seq データからの網羅的な遺伝子発現レベル解析手法」
場所:コラボステーションⅠ 共同セミナー室A・B
講師:成相直樹
近年、次世代シークエンサによるRNA-Seq 技術により、サンプルの遺伝子発現を網羅的かつ一塩基レベルの高解像度で解析することが可能となった。
本発表の前半部分では、これまでに提案されてきたRNA-Seqデータ解析手法である TopHat/Cufflinks、RSEM等を紹介し、それらの有効性及び問題点を指摘する。本発表の後半部分では、より高精度な遺伝子発現レベル推定を実現するため、モデルの複雑さ(転写産物の候補の数)、隠れ変数(マッピングの曖昧さ)、パラメータ(転写量)を、変分ベイズ推定により同時に最適化する統計的手法 TIGAR を紹介する。

14:30~16:30 トレーニング「TIGARによるRNA-Seqデータからの網羅的な遺伝子発現レベル解析実践」
場所:総合研究棟 ITルーム
次世代シークエンサから得られたRNA-Seqデータから、サンプルの遺伝子発現レベルを網羅的かつ高精度に解析するためのソフトウェアである TIGAR を利用する方法について解説する。リファレンス配列やアノテーション情報などソフトウェア実行のために必要なファイルの準備から、ソフトウェアの実行、解析結果の解釈、及び発現差解析などの下流解析まで実践する。

詳細
http://chromatin.med.kyushu-u.ac.jp/archives/218

第47回インシリコ・メガバンク研究会開催のお知らせ(2月28 日)

第47回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は産業技術総合研究所 生命情報工学研究センター・David duVerle先生を講師としてお迎えし、「高次元データにおける遺伝子の組み合わせ相互作用の発見」について講演していただきます。

・日時:平成26年2月28 日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:Discovering Combinatorial Gene Interactions in High-Dimensional Data
・講師:David duVerle(産業技術総合研究所 生命情報工学研究センター)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

要旨:In the past decade or so, new technologies in biotech have meant an explosion in the availability of high-dimensional genomic data (microarrays, SNP data, RNA-Seq…): their dimension and noise levels making it necessary to rely on machine learning techniques and statistical models to extract meaningful signal and narrow down the field for further experimental research. In this presentation, I will try to give a very general overview of some of the statistical techniques commonly used to treat high-dimensional data, as well as a more detailed illustration of the technique we developed to identify combinatorial interaction effects in such data.
A crucial aspect of machine-learning when dealing with high-dimensional data, is the concept of sparsity: how much of the input’s variables find their way in the model. By using regularisation techniques (the addition of a tailored penalisation component), it is possible to ensure certain properties of the statistical model (size, elimination of collinear variables…). Another, is the fitting of complex statistical models that cannot be solved analytically, usually requiring optimising a non-linear objective function (e.g to maximise likelihood or minimise empirical error). While relatively simple in application, both techniques require some understanding of the underlying statistical assumption and information theoretic implications, in order to obtain satisfying results.
After giving a brief overview of regularisation techniques and their use in typical regression problems encountered in bioinformatics, I will introduce our recent work, which combines them with data-mining (itemset mining) and fractional programming techniques to fit complex statistical models over (non-linear) combinations of heterogeneous input variables, allowing for example to identify sets of genes (up- or down-regulated) that drive complex phenotypes or clinical observations.
This work was in particular successfully applied to a combination of cDNA microarray and gene mutation copy number data paired with (right-censored) survival data, to identify interactions (and potential synthetic lethals) playing a role in neuroblastoma and breast-cancer.

・世話人: 長崎正朗

第45回インシリコ・メガバンク研究会開催のお知らせ(2月18日)

第45回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。今回は国立遺伝学研究所 斎藤成也先生を講師としてお迎えし、「日本列島人のDNA進化:その過去と現在」について講演していただきます。

・日時:平成26年2月18日(火) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:日本列島人のDNA進化:その過去と現在
・講師:斎藤成也(国立遺伝学研究所)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

概要:日本列島人の成り立ちについて、縄文時代から住んでいた「縄文系」と,弥生時代以降の「渡来系」の二つに考えて説明した考え方を「二重構造モデル」と呼ぶ。このモデルによれば、まず東南アジアに住んでいた古いタイプのアジア人集団の子孫が、旧石器時代に最初に日本列島に移住して、縄文人を形成した。その後弥生時代に移るころに,北東アジアからの移住があった。彼らはもともとは縄文人と同じ祖先集団から誕生し、その後独自の変化をして、顔などの形態が縄文人とは異なってきた。これら大陸からの渡来人は,先住民である縄文人の子孫と混血をくりかえした。ところが北海道にいた縄文人の子孫集団は渡来人との混血をほとんど経ず,アイヌ人集団につながっていった。沖縄を中心とする南西諸島の集団も,本土から多くの移住があったが,日本列島本土に比べると縄文人の特徴をより強く残した。以上のモデルは、おもに埴原和郎ら人骨データを解析した研究者が提唱したものだが、その後のゲノム規模SNPデータの解析結果も、この二重構造モデルを概略支持している。一方、古代人のDNAを直接調べる研究は、これまでミトコンドリアDNAが中心だったが、最近私の研究室と国立科学博物館を中心とした解析チームが、東北地方の複数の縄文貝塚遺跡から出土した人骨にのこっていたゲノムDNAの一部分を決定することに成功した。これらの結果は、縄文時代人が東ユーラシアの中できわめて特殊な集団だったことを明確にしめしている。今回の講演では、これらの、日本列島に過去から現在まで居住してきた人々のゲノムDNAの進化について、最新の成果を含めてお話しする。

・世話人:河合洋介、長崎正朗

 

第46回インシリコ・メガバンク研究会開催のお知らせ(2月21日)

第46回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。

今回は産業技術総合研究所 生命情報工学研究センター・Martin Frith先生を講師としてお迎えし、「元来の統計的アライメントにおける最新高スループットDNAの適応」について講演していただきます。

・日時:平成26年2月21日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:Adapting classic statistical alignment to modern high-throughput DNA
・講師:Martin Frith(産業技術総合研究所 生命情報工学研究センター)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

For many decades, the main way of analyzing biological sequences has been by comparing and aligning them.  This remains true today.  Modern tasks include: comparing whole genomes; aligning bisulfite-converted DNA reads to a genome; aligning long, high-error sequences from single molecule sequencers; aligning ancient or degraded DNA; comparing metagenomic DNA to a protein database. Over the decades, statistically powerful alignment techniques have been developed, including: log likelihood ratio scoring matrices, pair hidden Markov models, and probabilistic alignment.  Unfortunately, these methods are rarely used with modern deep sequencing data, This talk will also sketch how to incorporate some new features into classic statistical alignment: sequence quality data (phred scores); pairing relationships between DNA reads; and split alignment, where different parts of one query sequence may align to disjoint loci in a genome.  This is useful for genome rearrangements, spliced RNA splicing), and even whole genome comparison.  The statistical approach can tell us the reliability (unambiguity) of any part of an alignment.

・世話人: 長﨑正朗