yhlhhhhh yhlhhhhh - 每日与生物工程斗智斗勇到谢顶 综合讨论组

做了一个压缩微基因,23andme和23魔方的中通txt数据压缩命令行

命令行名称:zip-gene-test-data
pypi链接:https://pypi.org/project/zip-gene-test-data/0.0.1/
github链接:https://github.com/yhlhhhhh/zip_gene_test_data
下载方法:
法一:
pip install zip-gene-test-data==0.0.1
提示:此方法需要使用pip
法二:
直接在github的项目链接下载
使用方法:
1. Windows系统的同学如果没有Python先安装Python,Mac OS系统的同学就不用了,因为系统已经自带了。
2. 安装依赖库click,安装命令如下:
pip install click
3.程序运行命令:
python main.py start
之后按照命令行提示完成即可
压缩格式:
目前只支持输入输出的格式为txt,我WeGene2.0的原始数据原来大概30m,压缩之后是15m,扩展数据大概400m,压缩之后为200m
压缩格式说明:
将所有纯合位点缩写为一位字母,例如AA显示为A,杂合位点保持不变例如AG仍为AG。去掉了位置信息,染色体号。rsid与基因型间用|连接。
2021-07-15 • IP属地北京 • 发自微基因APP
按热门排序    按默认排序

3 个回复

果然放假后高产了很多
果然放假后高产了很多😀👍
热知识:gz 一般即可将 txt 文件压缩到原来的 1/3,高度重复的txt 文件压缩率更高

要回复问题请先登录注册