在科技领域,跨界、融合带来的新(xīn)生(shēng)事物具备的颠覆性竞(jìng)争,而只是技术和经济层(céng)面的竞争(zhēng)。
而在病毒领(lǐng)域,跨界、融合(hé)产生的新病(bìng)毒往往意(yì)味着灾难(nán)。一个天上(shàng)飞的鸟落下的粪便不小(xiǎo)心与地上某个禽(qín)类的食物结合(hé)被这个禽类所食,那么(me)其上可能带来的病毒与禽类(lèi)体内病毒进行杂交(jiāo)进化一个新(xīn)的病毒(dú)。而(ér)这个病毒获得跨界传播的(de)能力,将对整个(gè)人(rén)类造成大的灾难。最(zuì)快(kuài)速的(de)了解新的病毒带来的病例(lì)成因(yīn)早日实现对症下药,成为打赢“抗疫”的(de)关键。今(jīn)天(tiān)AI等新技术(shù)在积极发挥着作(zuò)用。
目前新型冠状病毒(dú)疫(yì)情进入了(le)攻坚战阶段。除了(le)一线医务人员前赴后继的战斗之外(wài),对于(yú)新冠病毒的疫苗研发和药(yào)物筛中(zhōng)也(yě)在争分夺秒的进(jìn)行(háng)中。此次“抗疫”战争中,AI等(děng)科技技术在(zài)默默贡献中。关注(zhù)抗击(jī)疫情(qíng)中的(de)科技(jì)公司的动向(xiàng),就会发现包(bāo)括阿(ā)里云(yún)、华为云、中科曙光、腾(téng)讯云(yún)、上海超(chāo)算中心等积极主动并免费提供超算能力,AI算(suàn)法来助力开展抗新冠(guàn)病毒的疫苗研发和(hé)药物(wù)筛选(xuǎn)中(zhōng)。
要最快解决此次新型(xíng)冠状病(bìng)毒(dú)疫情,目前来看除了(le)全(quán)国(guó)动员(yuán)在家“闷”死病毒之外,对于从(cóng)早期对病毒基因组的数据分析及AI建模到如何(hé)对疑似患者的快速、精准(zhǔn)临床诊断,以及抗新冠(guàn)病毒的疫苗研发和(hé)药物(wù)筛选中也需要和时间赛(sài)跑。在其中AI正在发挥其作(zuò)用。
AI技术能够加速“疫(yì)情”中数(shù)据分析
AI作为(wéi)一种工具,有三要素在支撑,算力、算法和数据(jù)。基于三个特(tè)点,目前AI等科技公(gōng)司都是提供具备高性能、高(gāo)可靠性、高(gāo)性价比的计算、存储、分析(xī)和AI能力支持的(de),能够让科研(yán)过程(chéng)固化可执行,提高(gāo)效率的工具。
而让AI在疾病基因(yīn)的分析和(hé)诊断中发挥。首先要(yào)依(yī)靠医学界的专家发现病毒。就像(xiàng)上海华(huá)山医院张文(wén)宏就谈到医疗(liáo)专家(jiā)要“要非常准确的知道现在搜索的病毒(dú)是什么,才能(néng)相应的病(bìng)毒做(zuò)相应的抗病(bìng)毒治疗。”
我们应(yīng)让人工智能(néng)与病理(lǐ)学家形成互补,提高人(rén)工诊断的效率与可靠度(dù)。依靠科(kē)技手段(duàn) “面对未知的病毒的时候,通过把其基因序列全部打碎,通过深度测序的平台(tái),把所(suǒ)有的(de)序列全部恢复,然后(hòu)通大数据开(kāi)始拼接,通过组装序(xù)列,经过大数据分析,分析出其演化(huà)关系(xì),通过数据库记录(lù)分(fèn)析(xī)获得遗传标志,来最终(zhōng)告诉你这(zhè)是(shì)什么病毒。” 张文宏站在医生的角(jiǎo)度言简意赅的(de)阐述(shù)了AI的作用。
portant;" />
比如针(zhēn)对此次新冠病毒,AI等新技术的应用一个核心的作用就是(shì)让医学(xué)专家(jiā)们不用把大量(liàng)的时间放在海量的数据分析上,而是能(néng)够将(jiāng)自己的(de)时间、精力以及(jí)医学经验投入到应对传染病风险之上。把(bǎ)数据分(fèn)析、重复的(de)信息的收集等任务,交给AI来处理。
目前集成了(le)AI功能(néng)的基因组测序平台能够(gòu)提供(gòng)从(cóng)基因组(zǔ)数据管理、生物信息分析流(liú)程(chéng)、科研(yán)分析管(guǎn)理到(dào)知识(shí)图(tú)谱整个流程的服务,快速实现基因组数(shù)据(jù)分析及AI建模,让基因(yīn)组分析(xī)更便捷(jié)。
比如将(jiāng)深度学习算(suàn)法及药物分析(xī)服务融入药物(wù)研发过程,令药企能更快速高(gāo)效地(dì)完成药物研发,节约研发成本(běn),让研(yán)发(fā)更快速。
具备医疗影(yǐng)像标注、影像分析服务及AI模(mó)型预测服务,全(quán)方位(wèi)满足医疗影像研发需求,让影(yǐng)像(xiàng)分析更方便。很大程度上帮助(zhù)了医生提高(gāo)阅片效(xiào)率、减少漏诊(zhěn)误诊(zhěn)的情况(kuàng)。一个医生可能一天(tiān)看一百个病人(rén),一个月看了两(liǎng)千个病人,一年可能看几(jǐ)万(wàn)个病人,他通过(guò)这样的方式去累计经验(yàn)。一(yī)个(gè)15年经验的医生,和一个刚出来做(zuò)3个月的医(yī)生,他(tā)们两个的经验不同,在对(duì)一些(xiē)影像图(tú)片上面的判断就不(bú)是一样(yàng)的级别。
portant;" />
深度学习会(huì)提取图像特(tè)征。然后影像专家先把上(shàng)面做(zuò)一个标(biāo)注(zhù),等到标(biāo)注(zhù)有更大的样本的时候,就可(kě)以做到辅助医学诊(zhěn)断。比如通过(guò)AI对疑似患者肺部CT影像进行(háng)病灶的自动检(jiǎn)出、定位、弥漫性程度的多维分析(xī)并(bìng)生成(chéng)自动报(bào)告(gào),帮助医护人员快速筛(shāi)查(chá)疑似新(xīn)冠病(bìng)例并进行隔(gé)离与进一步确诊,从而减少交叉感染的风险,同时产品的随访功能还可帮助医生对(duì)患者的(de)治疗效(xiào)果(guǒ)进(jìn)行精准量化评估,用AI为一线医务(wù)工作者提供有迹可循(xún)、有据(jù)可依的智能辅助。
联(lián)合科研成为AI技术(shù)应用在(zài)疾病领(lǐng)域的主要(yào)形式(shì)
在整个“抗疫”过程中,包括分离毒株、药物筛选、意(yì)思(sī)病例检(jiǎn)测、新药研发等需要基于AI技术进(jìn)行大量的数(shù)据分析。目前科技公司在(zài)病毒基因组计算分析、抗病毒药物研发(fā)和抗疫医疗影像分析领(lǐng)域(yù),将(jiāng)提供(gòng)海量AI算(suàn)力和算法(fǎ)的强有力(lì)支持。这就(jiù)需要具有(yǒu)强(qiáng)大的CPU及GPU算力调度能力(lì),能够为(wéi)基因测序、医疗(liáo)工程提供稳定高效的算力支(zhī)持的平台。
最近关于“抗疫”的战役中,我们看到科技公司联合医疗机构、科研机构成为最高(gāo)效的一种模式。比(bǐ)如华中科技大学同济医学(xué)院基础医学(xué)院、华中(zhōng)科技(jì)大(dà)学同济医学院附属武汉儿童医院、西(xī)安交通大学第一附属医院、中科院北京基(jī)因组研究(jiū)所、华为云(yún)联合科(kē)研团队宣布(bù),筛(shāi)选出五种(zhǒng)可(kě)能对2019新(xīn)型冠状病毒(2019-nCoV)有效(xiào)的(de)抗病毒药物。
其中华为云EI医疗智(zhì)能体(tǐ)平台(EIHealth)集成了医药领域众多算法、工具、AI模(mó)型和自动化流水线提供大规模(mó)计(jì)算机辅助。
portant;" />
在几位教授的指导(dǎo)下,针对数(shù)十个靶向(xiàng)蛋白(bái)和上亿小(xiǎo)分子化合(hé)物,通过医疗智能体平台(tái)完成了蛋白质同源模建(jiàn),分子动力学模拟计算,和大规模(mó)虚拟药物(wù)筛选,短(duǎn)时间内完成了(le)上千万次的模拟(nǐ)计(jì)算,让以(yǐ)往耗时数(shù)月的计算机辅助药物筛选在(zài)数小时内完成。
比如在新冠肺炎(yán)疫情上,疑(yí)似患者的快(kuài)速(sù)、精准临(lín)床诊断仍是挑战。2月1日(rì),由(yóu)浙江省疾(jí)控中心、阿里达摩(mó)院和杰毅生物联合研发(fā)上线的自动化全基因(yīn)组(zǔ)检测分析平(píng)台,让原来数(shù)小时的疑似病例基因分(fèn)析缩短至(zhì)半(bàn)小时。重点在“全基因组”这几个字,全基因组以为着海量(liàng)的基因(yīn)数据(jù),需要(yào)对平台的(de)算力、AI算法、数(shù)据处理和(hé)分更高的(de)要(yào)求。阿里达摩院创(chuàng)新的采用分布式设计的分析算法,并基于蛋白质数据库(PDB)等公共数据集的数据进行算法的优化训练(liàn)。这样的(de)AI突破,对于有效提(tí)升疑似病例确诊效率,及时阻断病毒的(de)传播,必然会有极大助益。
我(wǒ)们也看到为助(zhù)力研究机构(gòu)加速新药(yào)筛查和(hé)疫苗研发,腾讯(xùn)云组建了应急工作小组,免费开放云超算等能力(lì)。目前,已(yǐ)向中山大学药(yào)学院罗海彬教授(shòu)团队提(tí)供了批量GPU云服(fú)务器免(miǎn)费使用权,帮助该团队推进病(bìng)毒药物(wù)的筛选工作;向北京生命科学研究所/清(qīng)华大学生(shēng)物医学交叉研究院的黄牛教授(shòu)实验室提供了(le)大量标准的CPU算力以及对象储存(cún)能力,帮(bāng)助他们进行基(jī)于结构的(de)药物分子设计的离线计(jì)算(suàn)任务(wù)。
与此同时,基于新型冠状(zhuàng)病毒靶标结构的(de)化合物虚拟筛(shāi)选工作(zuò)正(zhèng)在北京生命科(kē)学研(yán)究所/清华大学生(shēng)物医学交叉研(yán)究(jiū)院黄牛教授(shòu)实验室推进。从(cóng)原(yuán)理(lǐ)上(shàng)讲,药物通过与(yǔ)体内的生物(wù)靶(bǎ)标相互作用而发挥药效,若能够根(gēn)据(jù)药物(wù)靶(bǎ)标结构来计算(suàn)筛选(xuǎn)和设计小分子配体,将可(kě)大大降低创新药(yào)前(qián)期研发的成本(běn)与周(zhōu)期。针对新型冠状病毒(dú)的多个靶点,黄(huáng)牛教授实验室通过腾(téng)讯(xùn)云秒级交(jiāo)付的海量(liàng)高性能计(jì)算(suàn)、存储资源,快速计算筛选数亿级别(bié)的化合物数据库,结合实验验证,来寻找新型结构(gòu)类型的先导化合物,为下一步新(xīn)药研发工(gōng)作提供依据。
总结,AI对于基因组的分析和(hé)诊断,有几个关键点。首先数据(jù)库的(de)检索功能,在获(huò)取到(dào)病毒基因信息后,通(tōng)常(cháng)需要与已知数(shù)据库的基因组匹配来(lái)找出可能存在的突变。而突变与疾病的对应(yīng)关系的判断大(dà)部分(fèn)依靠海量(liàng)的数(shù)据库资源(yuán),因(yīn)此(cǐ)如果人工来完成这些工作(zuò)是不现实(shí)的(de),这个时候便体(tǐ)现出了人工智能(néng)的价值。
其次算法的优化,我们看到包括华(huá)为云(yún)、阿里达摩(mó)院都是采用了最新的AI算法和(hé)分布式数据(jù)库,来优化(huà)人工智(zhì)能的(de)技(jì)术路(lù)径,能(néng)够更有(yǒu)效的对大量非结构化数据进行学(xué)习和整合,挖(wā)掘并计算其(qí)中的关联。缩(suō)短人工智能可以(yǐ)持续(xù)不断的挖掘并更新(xīn)突变(biàn)位点和疾病的潜在联系。
再次海量的数据(jù)喂养,与在Google AI实践中曾有关于诊(zhěn)断乳腺癌的人(rén)工智(zhì)能的报道。它只需几(jǐ)秒钟(zhōng),就能取得比人类医生花上(shàng)几十个(gè)小时还要准确(què)的诊断。在基于(yú)医学图像的(de)诊断上,结合人工智(zhì)能的效(xiào)率可以说是大大增加了癌病(bìng)的诊断。这需(xū)要基于大量(liàng)患者的成百(bǎi)上千张医(yī)疗影(yǐng)像,基于深度学习算法(fǎ)的(de)训(xùn)练。经历了(le)大量迭代训练(liàn)后(hòu),实现算法的精(jīng)准度越来越高,实现在疾病分析丰富临床经验的专家的诊断结(jié)果与(yǔ)AI工(gōng)具的诊断(duàn)结果是(shì)否一致来判断(duàn)AI分析(xī)的价值。
除(chú)此之外,业内专家对至(zhì)顶网表示(shì)目前基(jī)于“深度(dù)学习(xí)”的AI技术要发挥(huī)作(zuò)用(yòng),一个好的云数据库其实是非常(cháng)关键的一(yī)个点,因为如果医院里面每个科(kē)室的数(shù)字是零散的,那么很难(nán)做这个(gè)工作。基于云(yún)数据库,不管是从公有云还是从私有云,帮(bāng)助(zhù)医院把这(zhè)些数据规范起来(lái)。从数据的采集,到它的存储,到预处理,形成(chéng)一套规(guī)范的AI服务。这样的话,数据即(jí)使(shǐ)在有些单位是分散的,需(xū)要的时候还是可以复合起来使用。
同时在深度学习的(de)技术上面,对这些(xiē)数据做训练的时候,不仅仅是把数据丢到深(shēn)度学习里面去训练就好了,而(ér)且我(wǒ)们还要对这些数据做(zuò)一(yī)些特征提取。我们把数据的维(wéi)度降低了以(yǐ)后,再去训练就可以得到(dào)一个相对比较好的效果(guǒ)。当(dāng)然,这个数据(jù)积累以后,越来越多的(de)数据积累以(yǐ)后,准确率会越来越(yuè)高。
最(zuì)后,医疗过程是一个复杂,周(zhōu)期长的过程,AI辅助只是其(qí)中一个环节,我们希望能够通过AI等科技技术(shù)帮助到医药(yào)领(lǐng)域的专(zhuān)家,加速疾(jí)病基因检(jiǎn)测和相关药物(wù)研发(fā)过程。