【開催延期のお知らせ】(7月25日)第49回インシリコ・メガバンク研究会

7月25日に予定しておりました第49回インシリコ・メガバンク研究会は諸事情により延期となりましたことをお知らせいたします。 直前のお知らせになり誠に申し訳ございません。
なお、今後のスケジュールにつきましては、決まり次第ご連絡させていただきます。

第49回インシリコ・メガバンク研究会開催のお知らせ(7月25日)

第49回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。今回は国立遺伝学研究所 小笠原理先生を講師としてお迎えし、「遺伝子発現の進化モデル」について講演していただきます。

・日時:平成26年7月25日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク棟3階小会議室2   http://www.megabank.tohoku.ac.jp/access/access01
・演題:遺伝子発現の進化モデル
・講師:小笠原 理(国立遺伝学研究所)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

・概要:遺伝子発現の進化は形態進化と分子進化をつなぐための鍵となるのではないかという仮説が1970年代から存在する。この仮説はデータを得るのが困難であったことにより長い間検証されずにきたが、ゲノムワイドな遺伝子発現量の測定法の登場と普及により、その進化的変化の研究が可能となり始めている。これまでマイクロアレイやEST, RNASeqなどを用いた観測がいくつか報告されているが、その結果の解釈は研究者によりまちまちである。その理由は遺伝子発現進化の明確なモデルが未だ存在せず、配列の分子進化モデルのアナロジーを用いて解釈が行われているためと考えられる。これまでの発現進化モデルについて概説し、これまでの観察を統一的に説明する遺伝子発現進化のモデルの構築について紹介する。

・世話人:長﨑正朗

第48 回インシリコ・メガバンク研究会開催のお知らせ(7月11日)

第48回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は東北大学生命科学研究科・牧野能士先生を講師としてお迎えし、「重複遺伝子の進化学的研究と生態学・医学分野への応用」について講演していただきます。

・日時:平成26年7月11日(金) 17:00‐18:30
・場所:東北メディカルメガバンク棟3階 小会議室2 http://www.megabank.tohoku.ac.jp/access/access01
・演題:重複遺伝子の進化学的研究と生態学・医学分野への応用
・講師:牧野能士(東北大学大学院生命科学研究科)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

・概要:遺伝子がコピーされる突然変異である遺伝子重複は、主として新規機能を持った遺伝子の創出メカニズムとして着目されてきた。遺伝子重複により機能が分化した遺伝子が増加すれば、環境から受ける様々な撹乱に対するロバストネスは高まる事が予想される。我々は、哺乳類やショウジョウバエ属のゲノム情報既知種に着目し、ゲノム中に含まれる重複遺伝子の割合が高いほど、生息する環境が多様性であることを見出した。ゲノム中の重複遺伝子を調べることで種の環境変化に対する脆弱性や侵略性を測ることが可能になれば、全く新しいアプローチによる外来種問題や生物保全への取り組みが期待できる。また、個々の遺伝子の重複ではなく進化過程において希に全ての遺伝子が倍加する全ゲノム重複が起こることがある。全ゲノム重複は生命システムのロバストネスを飛躍的に高め、絶滅の回避や種子植物・脊椎動物の成立などの大進化に寄与してきた。一方で、全ゲノム重複後に消失せず保持された重複遺伝子(オオノログ)はロバストネスには寄与せず、他の重複遺伝子と区別する必要がある。それどころか、オオノログは疾患に関わる傾向が強い。オオノログが持つ特殊な性質である遺伝子量均衡性について概説し、オオノログが疾患関連遺伝子である具体例を紹介する。

・世話人:佐藤行人、長﨑正朗

 

医療ビッグデータ・サミット2014にて講演 : 長﨑教授 (7月7日)

長﨑正朗教授が7/7に医療ビッグデータ・サミット2014にて講演を行いますのでお知らせ致します。

日時:7月7日(月) 12:55 – 13:45
【地域の取り組み】医療情報と遺伝情報を集積して個別化医療を実現

場所 : ソラシティカンファレンスセンター(東京・御茶ノ水)
講師:長﨑正朗

詳しくは下記のリンクをご参照下さい。
http://techon.nikkeibp.co.jp/article/SEMINAR/20140515/352080/

長﨑研:研究室住所変更のお知らせ

長﨑研究室が加齢医学研究所より、
東北メディカル・メガバンク棟へ移設いたしました。
新住所は下記になります。

〒980-8573
仙台市青葉区星陵町2-1
東北メディカル・メガバンク棟4F
東北大学 東北メディカル・メガバンク機構 ゲノム解析部門
バイオメディカル情報解析分野
長﨑研究室

アクセスについてはリンクをご参照下さい。
http://nagasakilab.csml.org/ja/access-2

DSC_0035

九州大学にて講演 : 長﨑教授, 成相助教 (3月18日)

長﨑正朗教授、成相直樹助教が3/18に九州大学馬出キャンパスにて講演を行いましたのでお知らせ致します。

日時:3月18日(火)
「よく分かる次世代シークエンサー解析~最先端トランスクリプトーム解析~」

場所 : 九州大学馬出キャンパス コラボステーションⅠ 共同セミナー室A・B 総合研究棟 ITルーム
講師:長﨑正朗、成相直樹

13:00~13:30 セミナー「日本人1000人の全ゲノムの解析の現状と課題」

場所:コラボステーションⅠ 共同セミナー室A・B
講師:長﨑正朗
東北大学東北メディカル・メガバンク機構では2013年11月29日に1000人ゲノムのシークエンスが完了した。本セミナーではヒトの全ゲノム解析の現状と見えてきている課題、現在得られている変異コールの精度,データの公開などを含め時間の取れる範囲で話を行う。

13:30~14:00 セミナー「RNA-Seq データからの網羅的な遺伝子発現レベル解析手法」
場所:コラボステーションⅠ 共同セミナー室A・B
講師:成相直樹
近年、次世代シークエンサによるRNA-Seq 技術により、サンプルの遺伝子発現を網羅的かつ一塩基レベルの高解像度で解析することが可能となった。
本発表の前半部分では、これまでに提案されてきたRNA-Seqデータ解析手法である TopHat/Cufflinks、RSEM等を紹介し、それらの有効性及び問題点を指摘する。本発表の後半部分では、より高精度な遺伝子発現レベル推定を実現するため、モデルの複雑さ(転写産物の候補の数)、隠れ変数(マッピングの曖昧さ)、パラメータ(転写量)を、変分ベイズ推定により同時に最適化する統計的手法 TIGAR を紹介する。

14:30~16:30 トレーニング「TIGARによるRNA-Seqデータからの網羅的な遺伝子発現レベル解析実践」
場所:総合研究棟 ITルーム
次世代シークエンサから得られたRNA-Seqデータから、サンプルの遺伝子発現レベルを網羅的かつ高精度に解析するためのソフトウェアである TIGAR を利用する方法について解説する。リファレンス配列やアノテーション情報などソフトウェア実行のために必要なファイルの準備から、ソフトウェアの実行、解析結果の解釈、及び発現差解析などの下流解析まで実践する。

詳細
http://chromatin.med.kyushu-u.ac.jp/archives/218

第47回インシリコ・メガバンク研究会開催のお知らせ(2月28 日)

第47回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。
今回は産業技術総合研究所 生命情報工学研究センター・David duVerle先生を講師としてお迎えし、「高次元データにおける遺伝子の組み合わせ相互作用の発見」について講演していただきます。

・日時:平成26年2月28 日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:Discovering Combinatorial Gene Interactions in High-Dimensional Data
・講師:David duVerle(産業技術総合研究所 生命情報工学研究センター)

*本講演は医学系研究科系統講義コース科目の授業として振替可能です。

要旨:In the past decade or so, new technologies in biotech have meant an explosion in the availability of high-dimensional genomic data (microarrays, SNP data, RNA-Seq…): their dimension and noise levels making it necessary to rely on machine learning techniques and statistical models to extract meaningful signal and narrow down the field for further experimental research. In this presentation, I will try to give a very general overview of some of the statistical techniques commonly used to treat high-dimensional data, as well as a more detailed illustration of the technique we developed to identify combinatorial interaction effects in such data.
A crucial aspect of machine-learning when dealing with high-dimensional data, is the concept of sparsity: how much of the input’s variables find their way in the model. By using regularisation techniques (the addition of a tailored penalisation component), it is possible to ensure certain properties of the statistical model (size, elimination of collinear variables…). Another, is the fitting of complex statistical models that cannot be solved analytically, usually requiring optimising a non-linear objective function (e.g to maximise likelihood or minimise empirical error). While relatively simple in application, both techniques require some understanding of the underlying statistical assumption and information theoretic implications, in order to obtain satisfying results.
After giving a brief overview of regularisation techniques and their use in typical regression problems encountered in bioinformatics, I will introduce our recent work, which combines them with data-mining (itemset mining) and fractional programming techniques to fit complex statistical models over (non-linear) combinations of heterogeneous input variables, allowing for example to identify sets of genes (up- or down-regulated) that drive complex phenotypes or clinical observations.
This work was in particular successfully applied to a combination of cDNA microarray and gene mutation copy number data paired with (right-censored) survival data, to identify interactions (and potential synthetic lethals) playing a role in neuroblastoma and breast-cancer.

・世話人: 長崎正朗