東京大学医科学研究所附属ヒトゲノム解析センター 健康医療インテリジェンス分野の井元清哉教授・佐藤憲明助教の研究グループは、大阪公立大学大学院医学研究科 ゲノム免疫学の植松智教授 (東京大学医科学研究所附属ヒトゲノム解析センター メタゲノム医学分野 特任教授を兼務) らとの共同研究を行い、Kyoto Encyclopedia of Genes and Genomes (KEGG) に蓄積された情報を用いてマルチオミクスデータの可視化・解析を行う基盤的な R パッケージ ggkegg を開発しました。
本研究により開発した ggkegg は grammar of graphicsによる可視化の統合的なライブラリである ggplot2 を基に KEGG データを解析・可視化するパッケージです。 ggkegg を用いてトランスクリプトーム解析において複数のデータセットから得られた統計情報を基に、複数の KEGG パスウェイ情報とネットワーク解析を用いて重要な遺伝子クラスターを同定できることを示しました。また、公共データベースに登録されているクローン病患者の腸内細菌叢メタゲノムデータから、患者と健常者で差異のある代謝経路を KEGG の包括的な代謝経路情報に反映し、研究結果の効果的な可視化が可能なことを示しました。
ggkegg を用いることで、膨大な KEGG 情報を効率的に活用しながら得られたオミクスデータの生物学的な解釈をより深めることができると考えられます。パッケージはオープンソースで公開されており (https://github.com/noriakis/ggkegg)、生物学的データ解析パッケージを収載したリポジトリである Bioconductor からインストール可能で簡便に利用することができます。
詳しくは東大医科研プレスリリースをご覧ください。
本研究成果は 10 月 16 日 (日本時間) にバイオインフォマティクス分野の国際科学雑誌 Bioinfomatics に掲載されました。
Comments