(Gene) Ontologyの可視化

とりあえず、オントロジーのデータ(今のところ、OBOフォーマットを基本としています)を、Cytoscapeのグラフモデルを使って表現できるようにしました。

godag.png


今後は、このデータと実際のPPIネットワークをどの様に有機的に結びつけるかになるわけですが、一気にグラフを描画してしまうやり方は、GO Slim(GOのサブセット)程度ならば問題ないのですが、巨大なオントロジーだと現実的ではないので、これからUIを詰めて行こうと思います。少くと も、以下のような機能は実装します:

  • 選択したオントロジーのタームからネットワーク内のノードを選択
  • 選択したタームから、その子にあたるタームを含めたネットワーク内のノードの選択
  • オントロジーが巨大な場合、選択されたタームからルートターム(GOの場合はBiological Process, Cellular Component, Molecular functionの三つ)への全パスを選択的に標示

こんな機能があれば便利だな、と言うアイデアがあればぜひ教えて下さい。

広告

Gene OntologyとCytoscapeの統合

ここを読んで下さった方にお聞きしたい事があります。
現在、CytoscapeにはGO Termをインポートして属性として取り込む機能があります。しかしながら、これは初期のバージョンのレガシーなコードを引きずっていて、お世辞にも使いやすいものとは言えません。そこで次期バージョンでは、この機能の見直しが予定されています。今の予定では、

  • OBO、Gene Associationファイルの内容の完全なインポート
  • リモートサーバーからのインポートのサポート
  • XML形式、MySQL形式のテーブルのサポート
  • IDマッピング機能の拡充
  • GO Termブラウザ

この最後のブラウザなんですが、生物学者にとって使いやすいGO Termのブラウザとはどういったものなんでしょう?既にいくつかの実装が存在しますが(GOBUSpotfireなど)、いずれもツリー形式のビューアになっています。でも実際は、GOはツリーではなくグラフ(DAG)であり、ならばいっそのことグラフのモデルを使ってブラウジングできるようにした方が良いのだろうか?と考えたりもします。問題は、計算機に求めるリソースがグラフモデルの方が高価(メモリーやプロセッサのパワーを食う)という点です。ちなみに、GOのDAGをCytoscapeで表示すると、こんな巨大なものになってしまいます。
この周辺の機能に関して、何かリクエストやご意見などありましたら是非コメント下さい。
よろしくお願いいたします。