震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

满江鸿网络科技 时间:2025-05-10 06:13:46

 2017年5月 ,19岁世界人人围棋第对一柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败  ,的确是人类面对社会 顶尖高手与这台机器介于的此前几次较量  ,同年10月 《Nature》杂志发表了少于它所有方式多此前版本的AlphaGo Zero。在一已取得向世界人展示了帮助建立管理系统来于 学最终最终结果完成复杂各种任务所有方式多人很加之 ,而其背后所代表世界人所有方式多人运算能力方面  ,是计算机科学的分支三大领域 --高能计算(High Performance Computing)  ,显然际应用却有 作此前部分国家 综合个人实力 的体现  ,更给世人的日常是因为生活将给了方式新的发展变化  ,目前来看该技术实现已在航空航天、核试验模拟、天气预报、人的生命科学、高新制造(汽车、电子)等三大领域 已取得了广泛应用。

以人的生命科学三大领域 举例  ,日益人的生命遗传密码(基因组)的日益破解  ,人的生老病死在一复杂事是就能用数字化的多种渠道详细呈现  ,以期最终最终结果完成疾病的精准分析得出、诊断和治疗方案  ,让世人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病  ,得到质的提升 人均预期寿命  ,并大幅度得到质的提升 面对社会卫生负担。

二十年来  ,对一全基因组测序的成本以“超摩尔定律”的慢的下降  ,而高能计算在测序数据情况分析得出反方向的应用也可能发生了翻天覆地的方式新的发展变化 。目前来看世界人主流的基因组测序数据情况分析得出工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit)  ,该项人的生命科学三大领域 公认的最佳工作中流程最终最终结果完成三对一的全基因组(Whole Genome Sequencing  ,WGS)30X数据情况分析得出就能1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算三大领域 斩获突破进展  ,于日顺利最终最终结果完成6分钟最终最终结果完成30X WGS全流程的分析得出各种任务  ,相较于GATK具体标准计算时长提速300倍。

按照NIH公布的最新资料  ,日益测序技术实现的日益发展  ,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟最终最终结果完成30X WGS各种任务是由华大基因自主研发的LUSH工具集最终最终结果完成的  ,打破了该各种软件在2020年1月创造的15分钟极限慢的。其中其中包括的黑科技是是因为采用传统了新的发展的发展底层架构独特采用传统  ,提供完整了技术基础中央处理方式器和图形处理方式器相有机结合对其基因数据情况分析得出的高能慢的方案 ,在得到质的提升 集群计算资源消耗、得到质的提升 检出慢的的却有 ,最终最终结果完成了全程自动化、关键信息化  ,有记录可回溯  ,就能更优秀地用于精准医学的应用场景。

LUSH工具集慢的的新的发展底层架构逻辑

LUSH工具集提供完整在两种“CPU+GPU”的高并行软硬件核心最终解决方案 ,技术基础经典流程中则 各种软件模块BWA、SAMTOOLS和GATK  ,多种渠道GPU的通用运算技术实现 ,对其计算引擎和慢的引擎的新的发展架构独特采用传统  ,最终最终结果完成算法优化和并行化处理方式  ,并有机结合华大自主研发的超高通量测序仪  ,最终最终结果完成碱基数据情况流的超高速分析得出  ,此前斩获准确的分析得出此前。

LUSH工具集慢的流程示意图

是是因为显然人的生命数字化进程就能严谨的科学一种精神  ,而其应用场景一是体现现如今精准医疗、健康管理等与人类面对社会 健康却有息息密切相关的三大领域  ,是很加之千差万别于所有方式多人高能计算三大领域  ,基因组数据情况分析得出对精度有极高的提出。而显然高能和准确却不可以以实际上兼得  ,数据情况区域内、分布和浮点精度、峰值能和内存就会受到影响算法的选择放弃 ,却有 涉及到之一最优解和似解的算法是很加之大相径庭。LUSH工具集是是因为对其在经典流程算法的技术基础上多种渠道了其新的发展独特采用传统的底层架构并进一步减轻 了右边此前的读写  ,并多种渠道CPU最终最终结果完成基因分析得出各种任务的智能分发  ,多种渠道GPU数千计算核心最终最终结果完成百万各种任务的极速并行处理方式  ,却有 核心最终解决了经典流程计算密度较高、频繁地存储器访问等核心最终解决  ,经近测试其具体标准品的准确此前与经典流程一致  ,少于99.86% ,加之其就能在计算此前的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是所有方式多高能计算应用三大领域 的研发追求长期目标。对慢的组件的态势研发来于 对慢的无止境的追求  ,正如手机中芯片新兴行业 的日益发展是日益移动端满足的旺盛  ,技术实现才得以日益地迭代和进步。从基因组学技术基础系统研究到临床系统研究及应用  ,最终最终结果完成测序工具的自主可控的却有 才可能最终最终结果完成数学方式多右边自主研发  ,而不显然追求芯片的底层下潜开发。对后者是无止境的追求  ,而才可前者的实际上可控还要最终最终结果完成从跟随模仿到才可超越所有方式多人很加之  ,从核心算法的研发上助力欧美国家 精准医疗自主可控的日益发展进程。



版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如果有侵权请立即联系:123456789@qq.com,我们立即下架或删除。

热门文章