Chapter 3.7 Enzemblを用いた遺伝子オントロジーの抽出
当記事は・・・ 参考書「バイオインフォマティクス Pythonによる実践レシピ」を勉強中の初心者まじめちゃんが、書籍の感想を述べたり、書籍中のコードで出てきたエラーを修正していくブログ記事です。 めざせ脱バイオインフォ初心者!
今回は前回と同様にEnzembl の REST APIを使って、遺伝子オントロジーを抽出します。
オントロジーとは
情報学の用語で、複数の情報を読んで私なりに解釈したところ
「概念や属性の関係図」という言葉がしっくりきました。(個人のざっくりとした理解です)
その関係性は上位概念を起点として、下位概念に向かって枝を広げています。
これをオントロジー木と呼ぶそうです。
オントロジーとEnzembl
Enzemblでは最上位概念をmolecular_function、biological_process、cellular_componentとしてオントロジー木を作成することができます。
例えば、「バイオインフォマティクス Pythonによる実践レシピ」の例ででてきたLCT遺伝子だと
molecular function→触媒活性→hydrolase活性→glycosyl結合に対するhydrolase活性→・・・→lactase活性
というオントロジー木ができました。
Enzemblすごく便利ですね・・・!!このツールを使えば、酵素の立ち位置だったり、類似酵素をすぐに調べることができそうです。まさにインフォマティクスの強み・・・
ぜひ自分の研究でも導入していきたいです!(原核生物向けのツールもあるんでしょうか?)
Chapter 3.7デバック記録
途中までは順調に進んでいたのですが、最後に出てくる「pygraphviz」をcondaから全然インストールできないトラブル。。
(わりとよくインストールできないことがあるのですが、なぜなんでしょう・・・)
こちらのページにあるコードを上から順に試しました。
ですが、どのコードでもインストールできず。
環境によってはインストールできない場合があるという情報を発見。困る・・・
前に日をあけてインストールし直したらできたことがあったので、後日再度試してみます。
★
(3日後)
再度インストールしてみましたが、できません。
今必要なモジュールでないので今回は一旦ペンディングにします。