根据bed文件从fasta文件中获取基因序列

2018-11-22 08:44:34来源:博客园 阅读 ()

新老客户大回馈,云服务器低至5折

第一次写博客,分享一个做的提取基因序列的程序,根据bed文件里的位置信息从基因组里提取序列

源码地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py

bed文件通常用来保存注释基因信息BED文件必须的3列:

  1. chrom - 染色体号
  2. chromStart - feature在染色体上起始位置(其实编号为0)
  3. chromEnd - feature在染色体上末尾位置(不包括此编号)

  第四列是基因的名称

  还有些列想了解参考:http://genome.ucsc.edu/FAQ/FAQformat.html#format1

程序依赖 pyfasta模块(https://pypi.org/project/pyfasta/)

安装pyfasta的命令:pip install pyfasta

 

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:Python学习手册之函数和模块

下一篇:day16 类