Cytoscape 2.4の新機能紹介: オントロジーの可視化

ontology_networkpanel.png


2.4では、オントロジーの内部での扱いを大幅に変更しました。生物学者にとって、もっとも馴染み深いオントロジーと言えばGene Ontology(GO)でしょうが、他にも様々な概念が、計算機で扱えるオントロジーとして表現されています。生物学に関係のあるオントロジーだけでも、これだけのものが公開されています:

これらは、OBOフォーマット等の形で公開されています。そもそもこういったファイルには何が記述されているのでしょうか?GOのCellular Component(細砲構成要素)のトップレベルにあるTermを図で表わすと、このようになります:
ontology_cctop.png
一番左側の矢印(エッジ)は、「protein complexはcellular componentである」という関係を表わします。上位の概念に行く程その表わす範囲は広くなり、下位の概念はより狭い範囲を表わします。簡単な例で言えば、「ヒト」と言う概念を定義するのに、以下のような関係を定義できます:「ヒトは霊長類である」、「霊長類は哺乳類である」、「哺乳類は脊椎動物である」。このように定義して行けば、「ヒト」と言う概念を「ヒトは脊椎動物である」と言うように定義し直すことも出来ます。こういった明確に定義された概念の関係の集合がオントロジーと呼ばれるものです。オントロジーを使うことにより、様々な現実世界の事象を、共通の定義(語彙)に基づいて記述することが可能になります。例えば、上記のcellular componentと言う概念は、このような感じで可視化することが可能です:
ontology_cctop1.png ontology_cctop2.png
このような概念のグラフは、閉路(ある概念から、他の概念を辿り又自分自身へ戻るような経路)を持たず、有向(「XはYである」と言うように、概念の間に方向性が必ず存在する)であるため、計算機科学の用語ではDirected Acyclic Graph(DAG)と呼びます。
バージョン2.3以前にも、GOをインポートすることは出来ましたが、他のネットワークとは別の制限されたデータ構造を使っていたため、Cytoscapeの描画機能等を利用することは出来ませんでした。2.4からは、他のネットワークと同じように、特殊なケースのグラフとしてオントロジーも保存されます。最初のスクリーンショットにあるように、インポートされたオントロジーは「Ontology DAGs」という空のネットワークのもとに生成されます。
(つづく)

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中