west west - 早知道基因,早做健康管理哈 综合讨论组

【转发】DeepMind发布了一款利用DNA测序数据来预测基因表达的工具Enformer,可能会对遗传学领域产生深远影响

Transformer要逆天啊:DeepMind发布了一款利用DNA测序数据来预测基因表达的工具Enformer,可能会对遗传学领域产生深远影响。

当人类基因组计划成功地绘制出人类的DNA序列时,研究人员为有机会更好地了解影响人类健康和发展的遗传指令而感到兴奋。DNA携带着决定一切的基因信息,从眼睛的颜色到对某些疾病的易感性。人类体内大约有2万个被称为基因的DNA片段。

然而,这些被绘制的基因只占基因组的不到2%。剩下的碱基对——占基因组30亿个“字母”的98%——被称为“非编码”,包含关于基因应该在人体中何时何地产生或表达的不太为人所知的指令。

科学家们想要了解DNA突变是如何发生在距离不同基因很近和很远的地方,从而改变细胞内的RNA表达,最终影响蛋白质。目前最先进的预测基因表达的工具,都是基于卷积神经网络CNN的,但是卷积核的局部性限制了网络中远端神经元之间的信息交流。

Transformer架构已经证明了在自然语言处理NLP中特别适合处理长段落的文本,DeepMind开发者对其进行了改造,使其能够“阅读”大量扩展的DNA序列。最新的网络将神经元视野扩大了5倍以上,可以综合处理超20万个碱基对的相互作用,从而可以模拟被称为增强子(Enhancer)的重要调控元件对更远的DNA序列中的基因表达的影响,结果把基因表达预测的准确性提高了三分之一。

人类还远远没有解决基因组中的谜题,但Enformer在理解基因组序列的复杂性方面迈出了重要一步。未来使用人工智能来探索基本的细胞过程如何工作,它们如何在DNA序列中编码,以及如何建立新的系统来推进基因组学和对疾病的理解,将有助于临床研究更精确地了解DNA突变如何影响健康和疾病。

https://xueqiu.com/1039527614/199855086
2021-10-12 • IP属地深圳 • 发自微基因APP
按热门排序    按默认排序

1 个回复

yhlhhhhh - 每日与生物工程斗智斗勇到谢顶
又是DeepMind23333

要回复问题请先登录注册