Chapter 3.6 Ensembl REST APIを用いたオーソログ遺伝子の検出
当記事は・・・ 参考書「バイオインフォマティクス Pythonによる実践レシピ」を勉強中の初心者まじめちゃんが、書籍の感想を述べたり、書籍中のコードで出てきたエラーを修正していくブログ記事です。 めざせ脱バイオインフォ初心者!
このチャプターは自分のつまらないミスで時間を浪費してしまった・・・
「sequence」を「seqence」とスペルミスしたせいで1時間くらいコードとにらめっこしてた
プログラミングでよくあるミスの一種だけどやるせな~い😂
今回は、書籍通りにやればエラーは出ないです。
★
筆者はEnsemblになじみがなかったので少し調べてみました。 Ensembl=ゲノム解読されている真核生物のデータベース
https://asia.ensembl.org/index.html
NCBIのGenBankと似ているけどもっと真核生物独特の特徴に対応してる感じなんですかね
APIを使ってインターネットから情報にアクセスできるのが魅力ですね
使える機能は以下のリンク↓で確認できました
Ensembl Rest API – Ensembl REST API Endpoints
Ensembl 公式ページで種名やidで検索もできるようです。
lactase酵素の配列を覗いてみたらエキソンとイントロンがしっかり区別されて載ってました。
NCBIとEnsemblを比較
試しに両方のページでLCT遺伝子を検索してみました。
NCBIでは遺伝子座、転写される遺伝子のカバレッジ情報(FIG)まで載っていました
Ensemblはカバレッジ情報まではないけど、プロモーターetcの遺伝子制御に関わる遺伝子の情報もわかりやすく載っていますね。あとインターフェースがかわいい(笑)
NCBIのLCT遺伝子のページ↓
EnsemblのLCT遺伝子のページ↓
NCBIと違ってポップな雰囲気のインターフェースですね
Ensemblでは、サイドメニューからすぐ遺伝子配列情報に飛べました。
エキソンとイントロンが明確にわかるのも良いですね。
筆者は普段原核生物ばかり扱っているので、Ensemblのデータベースを扱う機会は少ないですが
ツールとして有力そうなので覚えておこうと思います🎶
(引き出しは多い方がよい)
「バイオインフォマティクス Pythonによる実践レシピ」(朝倉書店)の勉強に関するほかの記事は以下からお探しください
↓