塩基配列中に改行が入ったFASTAファイルを2行単位のFASTAファイルに変換するシェルスクリプトです。Linux環境で動きます。 アセンブルしたデータやオンラインデータベースからダウンロードしたFASTAファイルは、配列中に改行が入っていることがしばしばです。
この記事はすこし専門的な内容になっており、『生物学に特化した短編小説とエッセイ』とは別のマガジンに組み込まれています。 遺伝学とプログラミングに興味がある方はぜひ試してみてください。 ・fastaファイルに含まれる配列をアライメントして ...
Uses Biopython library for efficient FASTA parsing. Filters sequences based on a list of desired headers in a txt file. Prints IDs of extracted sequences for verification. Writes extracted sequences ...
ゲノム塩基配列データと遺伝子アノテーションのデータから、DDBJに登録する形式のファイルに変換するためのスクリプト群。 真核生物用、原核生物用、ミトコンドリア用に分かれています。 入力元ファイルとして、 ・ゲノムの塩基配列が記されたfasta ...