Chapter 3.4 ゲノムアノテーション・ファイルの解析

当記事は・・・ 参考書「バイオインフォマティクス Pythonによる実践レシピ」を勉強中の初心者まじめちゃんが、書籍の感想を述べたり、書籍中のコードで出てきたエラーを修正していくブログ記事です。 めざせ脱バイオインフォ初心者!

Chapter 3.4では、まずGFF (genetic feature format) や GTF (general transfer format) を操作するための「gffutils」 をインストールするところからスタート

こちらは普通にターミナル上で

conda install gfftils

とすればインストールできました。

そして毎回詰まるデータファイルのダウンロード、

相変わらずリンクの更新によりダウンロードできず (T T)

fastaファイルがあった Chapter 3.3 のときと同じ場所でgffファイルも見つかりました。

2022年2月4日時点でこちら↓のコードがワークしました!


import gffutils
import sqlite3
try:
    db = gffutils.create_db('https://vectorbase.org/common/downloads/Legacy%20VectorBase%20Files/Anopheles-gambiae/Anopheles-gambiae-PEST_BASEFEATURES_AgamP4.2.gff3.gz', 'ag.db')
except sqlite3.OperationalError:
    db = gffutils.Featuredb('ag.db')


Chapter 3.4は以上です

「バイオインフォマティクス Pythonによる実践レシピ」(朝倉書店)の勉強に関するほかの記事は以下からお探しください

“Chapter 3.4 ゲノムアノテーション・ファイルの解析” への1件の返信

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA