第三代基因测序腾“云”起航 企业降本增效交给华为云

时间:2019-09-18         浏览次数

  北京期望组生物科技有限公司(简称期望组)的首席新闻官朱赢,正在道到一年多前营业繁荣遭遇IT瓶颈时,举了一个情景的例子:咱们目前满载通量每天可以出现100TB的数据,假设线下机房现正在有一个PB的存储才力,只消10天就会存满。这100TB的存储资源我前期不妨依然花费了一百多万元,还只是硬件上的加入,不算电力泯灭和人力庇护本钱。资源不足奈何办?又要再花一百万,又要去巨资加入编造修理?

  动作环球最大的第三代基因测序企业之一,期望组正在2017到2018年设备告竣了完好的三代测序手艺平台,正式面向环球用户首先供应PromethION人类基因组重测序办事。纯洁地说,有关于二代测序手艺,三代基因测序的行使落地宛如将燃油车换成了高铁。

  “速率”疾了,测序才力也大幅擢升,可是通量产生式延长的同时,期望组也遭遇了最大的“瓶颈”。除了前面朱赢提到的存储资源困难,公司正在算力、IT运维、本钱限造和人力调配等许多方面都遭遇了挑拨。

  基于第三代基因测序手艺,固然能够同时举行大批基因片断的敏捷测序,数据的存储量也出现指数及延长。“要是要对这些数据文献举行阐发和揣测的话,大约每天都须要有十万核幼时的期间来告竣揣测。这是原有机房的算力无法联思的。”

  朱赢吐露,期望组的科学家、工程师厉重是从事基因钻探,就不太会正在IT方面花费太多心力和资源。“咱们必要要让钻探职员从IT根本方法的繁杂性里解放出来,让大师加入更多的元气心灵,回归本身应当起到感化的基因组学钻探上。”

  “实质上,这央浼咱们正在算力和存储方面,不但是资源充满的题目,还要有极强的扩展性,随时可以继续地往表扩充这种才力,并根据需求能收能放。”朱赢当机立断地说到,“咱们裁夺全体上云!”

  跟着上世纪90年代“人类基因组方案”的启动至今,人类的30亿个碱基和数万个基因序列已被测定告竣。基因测序,这一针对人类人命暗号举行“读取”的手艺,也从最初的一代,二代,慢慢进入了第三代。

  与此同时,跟着基因测序手艺的成熟,幼我基因测序行业敏捷进入繁盛时刻,越来越多合怀矫健和人命质地的人首先对基因测序提出了更大的需求。但是,第三代基因测序数据量较二代也崭露了百倍延长,正在出现越发科学、精准测序结果的同时,第三代基因手艺也遭遇了算力、存储才力等方面的IT资源瓶颈,殷切须要治理效力缓慢、投资伟大、本钱加多的困难。

  而与基因测序企业的挑拨相对应的,是民多正在享福基因测序办事时面对的痛点:测试期间耗时较长;专业测试用度激昂,商场价钱不透后乃至杂乱;缺乏威望的测试结果阐发解读……

  正在懂懂看来,“上云”恰是全豹基因测试行业面临挑拨的首选旅途,通过云揣测、大数据和AI算法等科技本领的帮力,治理这个行业的普及痛点,最终正在“降本、增效和革新”这三个要害词上赢得超过性的打破。

  “原来上云的题目,咱们两年前就依然首先研商了。开始术业有专攻,动作一家基因测序的公司,咱们的主业不正在IT;其次,咱们期望可以和一家贯通、懂得基因行业的云办事商团结。”

  朱赢当时比照过好几家云办事厂商,前期正在云化的经过中也踩了不少坑。而之后正式确定行使华为云,厉重是由于与华为云正在三个方面的高度契合:“一方面是华为云正在软件层面,跟咱们正在IT计议上的理念比力契合;第二个方面是咱们认同华为云正在底层手艺方面的能力,好比说它正在环球电信搜集修筑、芯片方面的研发能力;最终一个方面是由于华为云正在后端的手艺撑持和办事方面做得特别到位。”

  朱赢坦言,华为云正在云揣测界限并不是启动最早的企业,但恰巧是这三个方面的契合,让期望组裁夺与华为云配合生长,正在两边于各自界限即将起飞的阶段,沿途正在云揣测和基因行业杀青更多革新办法,为两个界限的协调繁荣带来少少改良。

  朱赢正在道到“理念契合”时夸大,原先期望组就依然选定了用云容器(Container)手艺计划来杀青本身关于揣测资源的多项需求,而华为云正巧将精准基因组阐发容器化治理计划动作了营业核心。

  华为云近年来向来正在研发方面一连加大加入,先后推出了云容器实例(CCI)办事、FPGA加快云治理计划和基因容器办事(GCS)等革新手艺。个中颇受期望组青睐的基因容器手艺,已成为基因行业的首选。华为云基因容器的特色是能供应大范畴的算力资源池,极大地擢升基因数据阐发效力,30X的全基因组测序(WGS)测序速率可擢升近10倍。

  同时,针对基因行业普及存正在的器械碎片化、开垦措辞多样、编造庇护麻烦等瓶颈,华为云的基因容器治理计划也着重正在“疾、省、易、捷”这四字上做足了盘算。

  “疾”,是指极速测序:撑持10万容器范畴,能够超高并发运转测序阐发流程,可极大的缩短测序时长,面临大范畴并发,得益于高职能容器批量揣测平台Volcano的高效做事更改才力,能够避免做事的死锁、节减等候期间,进一步擢升测序阐发效力 ;

  “省”,来自于高性价比:算力资源按需、按秒计费,CPU/内存遵照营业诉求聪明配比,避免浪掷,擢升性价比;

  “易”,正在于免运维:基于Serverless架构的容器办事,集群资源主动化扩缩容,阐发流程遵照预置正派能够主动化触发和履行;

  “捷”,便是一站式:将基因测序阐发与数据开采才力同一到一套流程内部,避免多套编造操作带来的未便。

  期望组与华为云团结打造的精准基因组阐发容器化治理计划即将揭橥。该计划以华为云基因容器动作根本平台,连接期望组正在基因行业内多年来的营业蕴蓄积聚,更靠近基因测序行业客户的诉求,杀青了更疾、更易运维、更高性价比的结果。这套计划将期望组原有的单流程时长从22幼时低落到了17幼时,并俭仆测序本钱30%。

  华为云负担基因测序行业的治理计划总监厉斌告诉懂懂条记,“咱们通过对客户深度的贯通,更好地配适用户的需求,为他们供应底层的IT手艺才力,同时也期望席卷期望组如许的企业可以连接自己营业提出更多诉求,促使咱们的研发团队供应更宏大的撑持力度,奉陪用户配合繁荣和生长。”

  除了与客户配合生长,华为云还期望通过合动作基因行业的生态处境做出功劳,“为了更好地办事于基因测序行业,咱们和期望组打造了团结实习室。初志和方针便是满意基因行业客户的需求,能正在第偶然间敏捷相应、敏捷闭环,同时合力帮帮行业造造更好的生态气氛。”厉斌吐露。

  而今,通过与华为云的团结,期望组的200多位科研职员得以聚焦自己的焦点事业,同时正在协调革新中赢得了更多基因界限的学术和手艺革新,席卷正在威望学术期刊公告多篇论文,以及团结揭橥了基因行业的通用揣测法式。

  同时,正在国内基因行业中Top15的企业依然有13家采用了华为云的办事。个中,上海其明新闻手艺有限公司正在华为云容器CCI撑持下,其基因检测与基因云揣测的归纳平台GCBI已告竣25万例基因数据阐发和开采、协帮作出1万多次基于基因新闻的临床决定。数据显示,将营业摆设正在CCI后,上海其明的实质揣测本钱低落了30%~50%,杀青了K8S和物理资源免运维。

  正在AI辅帮宫颈癌筛查界限,广州金域医学联袂华为云赢得了宏大打破。本年6月中旬,两边团结告示初次基于病理形状学,通过深度研习手艺操练出精准、高效的AI辅帮宫颈癌筛查模子。加倍正在AI手艺撑持方面,华为云全流程模子出产办事ModelArts从标注、操练模子、图片鉴定、推理等方面,都为AI模子的操练和行使供应了极为坚实的根本。

  其它,金橡医学联袂华为云共修的肿瘤精准医疗基因大数据阐发平台,图灵生物与华为云团结开垦的生信数据阐发管造平台——GenoStack生信云平台,峰科揣测与华为云配合推出的基于FPGA的基因加快云治理计划等,都依然成为国内基因科学界限行业云化的告成案例。

  数据显示,2016年国内插手消费级基因检测并具有自己数据的幼我用户总量约为10万人,2017年约为30万人。目前,中国幼我基因检测办事的生齿排泄率是0.03%,而来日5年这一数字会到达3.5%。

  这些数字意味着,到2022年中国将有5000万人具有本身的基因组数据。面临急忙产生的商场需求,国内基因测序势须要加疾全行业云化的程序,以应对行业转机的时机与挑拨。

  跟着基因科学界限的全体繁荣以及数据核心的全体云化,基因测序行业“上云”是形势所趋。正在基因测序界限,以数据阐发、云揣测为主导的IT手艺依然成为驱动行业革新、改造的主要要素。通过宏大的资源、完好而优秀的产物组合以及宏大的办事才力,华为云正正在为更多基因测序和生物科技企业供应着不同化、专业化的办事,这也是华为云能熟行业内Top15企业中团结率凌驾85%的厉重情由。

  基因测序企业的上云标的是降本、增效和革新,而民多关于基因测序的需求则是越发实惠、检测更疾,以及杀青本身对人命品格的高主意探索。于这两方面,坚信华为云能够做到更多。

  9月18日,期望组与华为云将正在HUAWEICONNECT 2019现场,揭橥团结打造的精准基因组阐发容器化治理计划,敬请合怀。