yhlhhhhh yhlhhhhh - 每日与生物工程斗智斗勇到谢顶 综合讨论组

利用Python读取fasta文件并进行一系列操作(三)

概述:
本节目标:计算智人与猩猩ABO基因的相对熵
语言:python3.8
模块:pysam, scipy
整体思路:先计算出序列中“AG”“CT”“AC”“AT”“GC”“GT”六种组合序列所占比,再计算相对熵
步骤:
1. 利用pysam模块分别读取智人ABO基因所有序列和猩猩ABO基因所有序列

截屏2021-06-23_下午3.48_.26_.png

 
2. 利用split函数切序列并用len函数返回结果-1,分别得出六种组合序列数量,再求占比

截屏2021-06-23_下午3.54_.16_.png

 
3. 利用scipy模块的entropy函数求相对熵

截屏2021-06-23_下午3.55_.45_.png

 
结果:
0.6930868205144018
2021-06-23 • IP属地北京
按热门排序    按默认排序

0 个回复

要回复问题请先登录注册