Chapter 3.4 ゲノムアノテーション・ファイルの解析
当記事は・・・ 参考書「バイオインフォマティクス Pythonによる実践レシピ」を勉強中の初心者まじめちゃんが、書籍の感想を述べたり、書籍中のコードで出てきたエラーを修正していくブログ記事です。 めざせ脱バイオインフォ初心者!
Chapter 3.4では、まずGFF (genetic feature format) や GTF (general transfer format) を操作するための「gffutils」 をインストールするところからスタート
こちらは普通にターミナル上で
conda install gfftils
とすればインストールできました。
★
そして毎回詰まるデータファイルのダウンロード、
相変わらずリンクの更新によりダウンロードできず (T T)
fastaファイルがあった Chapter 3.3 のときと同じ場所でgffファイルも見つかりました。
2022年2月4日時点でこちら↓のコードがワークしました!
import gffutils
import sqlite3
try:
db = gffutils.create_db('https://vectorbase.org/common/downloads/Legacy%20VectorBase%20Files/Anopheles-gambiae/Anopheles-gambiae-PEST_BASEFEATURES_AgamP4.2.gff3.gz', 'ag.db')
except sqlite3.OperationalError:
db = gffutils.Featuredb('ag.db')
Chapter 3.4は以上です
「バイオインフォマティクス Pythonによる実践レシピ」(朝倉書店)の勉強に関するほかの記事は以下からお探しください
↓
“Chapter 3.4 ゲノムアノテーション・ファイルの解析” への1件の返信