第40回インシリコ・メガバンク研究会を下記のとおり行いますのでご案内いたします。今回は統計数理研究所・小森理先生を講師としてお迎えし、「一般化t統計量の漸近的性質の考察とその実データ解析への応用」について講演していただきます。
・日時:平成25年12月6日(金) 17:00‐18:30
・場所:東北メディカル・メガバンク機構2階会議室1
・演題:一般化t統計量の漸近的性質の考察とその実データ解析への応用
・講師:小森理(統計数理研究所)
*本講演は医学系研究科系統講義コース科目の授業として振替可能です。
概要:高次元データの解析において臨床医療またはさまざまな病気の診断に有効な変量(マーカー)の探索は近年ますます重要になってきている。遺伝子発現量のデータのような高次元の連続量のデータ解析においては、t統計量やc統計量(AUC)などが変数絞り込みの段階でしばしば用いられる。今回我々はこの検定統計量の一つであるt統計量に着目し、単変量ではなく多変量の線形結合を考えることでこのt統計量を判別問題に応用することを考える。t統計量に対し生成関数であるU関数を考えることにより、さまざまなt統計量の一般化が考察できる。 一つの結果としてt統計量、c統計量(AUC)、Fisher線形判別、Kullback-Leibler divergenceとの密接な関係が明らかになった。またこの手法の実データへの応用例として一般化t統計量にL1ペナルティをつけたLassoタイプの手法を提案する。この手法の一つの特徴として、あらかじめ有用であることが分かっている変量(発症リスクに関連が深い変量)を固定したうえでその他の変数の選択ができる点があげられる。シミュレーションと実データ解析においてその有用性を検証する。また将来的にはSNPのような離散的なデータに対しても適用可能な統計的手法を考えて行きたい。
世話人:田宮元、長﨑正朗