英特尔:以技术筑梦精准医疗

时间:2017-01-19 16:24:09来源:中国医院院长杂志作者:刘文生
除了医疗卫生行业的支持外,精准医疗离不开其它行业的支持,尤其是计算领域的支持。

“2020年,一天之内可以完成全基因组测序,锁定癌症相关基因,形成个性化用药和修复方案。”

这不是科幻电影中的桥段,而是精准医疗快速发展下在不远的将来可能实现的目标。在信息化产业的核心技术提供者英特尔看来,到2020年,完成包括基因序列检测、数据分析、疾病诊断,以及制定个性化治疗方案在内的精准医疗的主要过程也许用不了24小时。
精准医疗将患者个体特性包括基因、环境以及生活方式等各个方面综合考虑应用于个体化疾病的预测、预防、诊断和治疗。与传统医疗面向群体、标准化且以“治”为主的模式相比,精准医疗以个体数据为基础,更强调疾病的预测、预防和个体化诊疗。
生物医疗数据的爆炸式增长给计算技术带来新的挑战。英特尔以计算技术为起点,与国内精准医疗合作伙伴一起,共同实现“2020年,一天完成基因数据的采集、分析和解读”这一目标。
中国启动“精准医疗计划”
在包括中国科学家在内的六国科学家的共同努力下,首个人类基因组草图于2001年发表,它标志着人类基因组计划的成功完成。人类基因组计划是生命科学发展史上的里程碑,它推动了人类在疾病研究领域的进步,带动了基因测序技术的进步和发展。之后,基因测序费用持续下降,目前一个全基因组测序费用已接近1000美元。 基因测序技术的进步催生了生物信息学的出现,促进了生物技术与信息技术的融和,共同推动了精准医疗这一理念的出现和发展。
精准医疗蕴含巨大社会经济效益,因此得到各国政府的重视。欧盟于2012年建立个体化医疗欧洲联盟,全方位推动个体化医疗的发展、落地和普及。美国2015年推出“精准医疗计划”。精准医疗计划的推出有助于刺激生物技术、生物信息技术、计算技术、制药和医疗服务等各个技术领域和行业的创新以及发展,为社会提供了更多的工作机会。
2016年3月,科技部发布精准医疗“国家指南”,启动中国版“精准医疗计划”。中国版精准医疗主要包括三个层次,层次间逐级提高,难度呈几何级数加大。
基础层次方面,基因测序是精准医疗的基础。无论是细胞治疗还是基因治疗,首先要通过基因测序诊断病情才能设计方案。在实施精准医疗方案过程中,需要大量的细胞和分子级别的检测。基因测序工具分为测序仪和试剂,医疗器械公司可以顺势介入测序设备生产领域。
中等层次方面,主要涉及细胞免疫治疗。通过对免疫细胞的功能强化和缺损修复,提高免疫细胞的战斗力。这种技术治疗癌症效果好,但操作难度大,对患者身体素质要求较高,难以大面积推广。
最高层次方面是基因编辑。癌症本质上是人体基因变异导致的细胞分裂失控。基因剪辑就是对患者癌变细胞的变异基因进行批量改造,使之成为正常细胞。
在分析人士看来,与美国相比,中国发展精准医疗具有政策执行、医疗资源集中、临床资源丰富三大优势。
中国工程院院士、北大医学部主任詹启敏在一次公开演讲中指出,中国精准医学采用统筹规划、分段实施,在总体目标的基础上,分为五年目标和十五年目标。
五年目标:我国精准医学研究和临床水平位于国际前沿,部分具有中国特色疾病诊疗水平引领国际发展;针对某种肿瘤、心脑血管疾病、糖尿病、罕见病分别创制出8~10种精准治疗方案,并在全国推广实施。
十五年目标:我国精准医学整体实现创新突破和临床应用,带动相关企业发展;重点研究疾病的诊疗标准和指南;在精准医学主要研究单位和试点地区,重要肿瘤早诊率由目前的20%提高到40%以上;遏制新生儿出生缺陷率上升趋势,将发生率由5.6%降低到3.0%以下;主要心血管病的病死率和致残率降低10%。
这两个阶段的重点任务是,2016-2020年组织实施中国精准医学科技专项,重点开展恶性肿瘤、高血压、糖尿病、出生缺陷和罕见病的精准防治治疗;加强创新能力、监管法规、保障体系建设;2021-2030年在已建中国精准医学研究体系基础上,扩展到其他重要疾病领域。
分析认为,要实现精准医疗这一宏伟愿景,还有很多挑战摆在前面。比如,在精准医疗实践中,如何在充分利用数据的同时有效地保护个人隐私,如何促进研究数据分享以推动行业整体进步,如何保证数据在精准健康和临床应用环节的有效性并逐步建立合理的标准,如何有效地投入以推动生命科学研究并探索支付机制为精准医疗的发展提供动力,如何为精准医疗提供可用的计算平台等等。
此外,随着生物技术的发展和逐步成熟,将生物信号转换成数字信号变得容易,生物技术也不再是精准医疗事业发展的主要瓶颈。然而随着生物数据的爆炸式增长,更多的挑战出现在计算技术领域,尤其是存储、计算和传输等基础技术领域。
面对这些挑战,一方面需要借鉴其他国家和地区的经验,更重要的另一个方面是要通过实践来探索解决这些挑战所带来的问题,保证精准医疗事业的快速和健康发展。
基因解析量化描述生命
美中宜和综合门诊中心CEO于莺曾在英特尔主办的“数据分析与精准医疗”活动上分享过一个案例。于莺就碰到过这样的患者,由于肿瘤长在特殊的位置,如第四侧脑室,虽是良性但往往因位置特殊无从下手而导致无法医治。在帮患者转诊到梅奥时,于莺又碰到了更大的困难,患者到美国医疗机构就诊不会有片子出来,它完全是一个带格式、方便网络传输和后续医疗机构拿到数据进行存储、分析甚至进行三维重建的片子,在中国都是相片性质的底片。患者数据传输的不流畅给治疗带来了巨大的不便。
作为一个急诊科医生,于莺每天都会看到很多类似的肿瘤患者,看到他们千奇百怪的治疗方案时,她非常懊恼和无奈。这样的癌症患者,治疗方案为什么不能统一呢?于莺开始思考通过精准医疗为患者带来更好的治疗方案。
通过基因测序技术可以很好地判断疾病,作为医生如何判断这些数据的可靠性、这些数据跟医院的PACS系统有没有对接都是摆在面前的问题。“我们作为一个私立医疗机构,会跟很多基因公司、智能医疗硬件公司进行合作,这个合作前提是什么?就是信息共享。”于莺解释道,未来,技术将成为精准医疗的首要支撑。
行业的共识是,除了医疗卫生行业的支持外,精准医疗离不开其他行业的支持,尤其是计算领域的支持。
在精准医疗过程中,不管是基因检测还是基因分析,技术尤其是计算技术在其中的作用日益凸显。不论是应用高性能计算让检测速度变快,还是利用分析处理能力找到靶向,都离不开大数据、云计算。英特尔作为计算领域的领导者,一直都致力于应用技术改变医疗服务。
2015年10月,英特尔公司、华大基因、阿里云在深圳正式签署战略合作备忘录,宣布启动精准医疗开放云平台的共建工作。该平台将成为中国乃至亚太地区首个定位精准医疗应用的云平台,也将是首个跨越行业边界,凝聚IT企业、基因和生命科学机构及公有云服务提供商合力铸就的精准医疗云平台。
据了解,该精准医疗平台包含一个测序平台以及一个混合云计算平台。其中,测序平台与基因计算一体机可以安置在用户一端,提高测序以及数据初步运算的效率。复杂运算部分,包括与基准数据库的对比,对数据结果的解释,二次分析以及可视化等可以通过云计算解决。云计算提高了整个平台的弹性,可以满足不同应用场景下不同的计算需求,降低计算成本,并提高数据平台的可用性。
对于三方来说,合作的基础就是计算,大量的计算。对于实际使用者华大基因来说,进行基因分析需要大量的计算资源,甚至需要投入大量的时间、人力、财力和计算资源才能完成。
华大基因CEO王俊曾在一次论坛上表示,生命科学已经不再像以前那样简单地在实验室里面做实验,或者是观察科学。从基因开始一直到表型,是海量数据的输入,这些数据的输入需要起码做到100万人。比如对身高基因的判断,在营养均衡的情况下,身高显然跟遗传有关,到底跟哪个基因有关系,现在不清楚。需要多少人弄清楚?需要100万人。如果有100万的基因数据和身高数据,就可以很准确地把身高给预测出来。
对于英特尔和阿里云来说,它们的主要任务就是帮助华大基因尽可能实现“免费”的目标,为此阿里云为华大基因提供了具备高性能计算的公有云平台,华大基因的BGI Online也在上面运行。对于英特尔来说,一方面它的处理器、协处理器对于计算效率的提升大有帮助,另一方面英特尔也正在帮助华大基因进行软件算法、系统架构与程序上的优化,以便进一步提升相关软件的运行效率。
事实上,技术的进步使得量化描述生命成为可能。在生命发展过程中,将遗传基因的分子生物学数据、医学影像数据或者是电子病历数据、可探索的环境数据、社交数据等所有这些数据放在一起,就可以相对比较量化地描述每一个人。目前,对基因的解析可以进一步量化描述每个人的生命。
对计算技术提出新挑战
随之而来的问题是,每一个人的DNA是由30碱基对组成的非常长的序列分子,也就是3G的数据。因此在进行数据分析时,通常每一个人的数据都是TB以上级别的,如果把不同时间点的数据进行联系,这种超摩尔定律发展的全局数据、频繁采样、实时计算对计算、存储和网络基础设施提出了更高的要求。
“计算机系统是摩尔定律的发展,当有一个数据发展像生命科学超摩尔定律的话,必然成为一个新的瓶颈。这对计算机行业来讲既是挑战,更多也是机会,这也是为什么我觉得英特尔会在精准医疗方面有非常大的潜在贡献的原因。”华大基因首席科学家李英睿在上述英特尔主办的活动上说。
实际上,精准医疗在基础架构、系统和应用各个层面对计算技术提出了挑战。生物信息数据的激增给计算技术带来空前挑战。完成一个人的全基因组测序,测序仪产生的原始数据往往达到1TB。比对分析后的基因序列变异数据也达到1GB。
英特尔发布的《计算技术助力中国精准医疗白皮书》(以下简称《白皮书》)指出,医学研究人员往往还需要将患者的基因数据与公开数据集或者私有生物样本库的数据进行比对分析,分析过程也将产生大量的中间数据。种种挑战导致一个典型的基因数据分析流程往往需要几天甚至几周的时间来完成。如何实现高效的数据分析尤其比对?如何实现不同大型数据集之间的高效集成?如何实现数据的快速检索和存储?对于计算机性能和基础架构提出了挑战。
    精准医疗对计算平台的可扩展性也提出了很高的要求。要实现良好的可扩展性需要在系统、硬件、软件和网络等多个方面来解决问题。在传统的研究机构中,往往采用高性能计算集群来解决生物信息分析的需求。然而高性能计算技术对于操作人员的要求很高。此外,传统的数据分析工具也常忽视可扩展性。
云计算提供的弹性计算为更大规模的数据分析提供了可能性。一些基因数据分析工具和流程正在逐渐迁移到分布式的计算架构上。如何改造优化现有的分析流程和工具,更好地利用云计算进行数据分析?如何安全高效地将海量数据传输到云端甚至远程存储,是云计算在精准医疗中应用的主要的挑战。
《白皮书》指出,应用层面上,对于生命科学研究机构和医院来说,建立完善的生物信息技术团队和相应的计算基础设施的成本很高。如何实现便捷的安装部署,降低日常维护的成本?为达成精准医疗的目标,通过何种方式来应对海量数据的访问需求?研究机构之间如何实现高效的数据分享并保证其安全性?基因数据的临床解读无论在研究还是临床上依然面临重大挑战。如何提供快速的分析工具使得医学研究者和用户能够更好地理解人类疾病和基因数据之间的关联关系?机器学习和人工智能技术如何有效地应用在精准医疗中?这些问题依然需要在技术实践中摸索答案。
英特尔:新技术助力精准医疗
精准医疗的核心基础是数据。数据驱动的生命科学基础研究、药物创新以及健康和临床实践是精准医疗的本质。由数据到知识再到应用转化的过程中,建立统一可行的数据分享原则、框架以及相应的技术平台来规范数据的分享是必要和有利的。
数据到知识的转化过程不是一蹴而就的过程,它需要研究协作和持续积累。单个研究单位积累和能利用的数据集合有限,难以支撑广泛有效的研究结果。此外,研究数据集合之间的差异也会导致研究之间难以互相论证。建立统一的数据分享原则和框架,并通过标准的平台分享数据为研究单位之间的协作提供了前提和基础。
针对以上要求,英特尔正持续为产业界合作伙伴提供创新产品与技术,并与合作伙伴齐心协力实现计算能力的发掘和释放。英特尔®至强®处理器与至强融核®处理器以其高效、稳定的并行计算能力和数据处理能力,正成为精准医疗的三个重要环节(包括生命科学研究、药物研发创新以及健康和临床转化等)提供数据分析和测试的有效工具。
此外,可支持高速、低延迟数据传输能力的英特尔®Omni Path Fabric互连技术、有助于大幅提升网络通信效率的英特尔10GbE和40GbE万兆以太网技术、能够显著加速数据访问效率的英特尔®固态硬盘和英特尔®企业版Lustre分布式文件系统等软硬件产品线与至强处理器®与至强融核®处理器协作,在相关应用软件代码实现优化的基础上,能够在精准医疗各个环节上发挥大数据的计算、数据存储和传输作用。
精准医疗愿景的实现还有赖于系统级的技术创新:依托于数据中心技术,构建针对精准医疗的大规模、高效、经济的云计算平台。英特尔在存储、网络及系统等各方面的关键技术和产品都将深入影响云平台的功能和性能。特别是高速的非易失性内存技术、超高速以太网互联技术等,将对云平台的演进产生实质性的促进作用。解构式数据中心架构及资源池化技术也将对平台成本及能效指标造成关键性提升。
有关精准医疗的核心步骤,即如何进行大规模、安全、高效的数据分析,英特尔还持续为各种分析场景提供算法级的优化,包括针对CPU指令集进行优化的编译器、并行算法库、机器学习算法库等。近年来英特尔在图形处理引擎(GPU)、协处理引擎以及其他基于特殊硬件的加速引擎等方面正在大力投入,值得精准医疗行业持续关注。
精准医疗是未来医疗模式发展的重要方向之一。数据是精准医疗行业发展的基础,数据的计算、存储和传输是精准医疗的重要支撑技术,也是精准医疗行业发展所面临的重要挑战之一。英特尔通过提供高效的计算、存储和传输技术助力中国的精准医疗事业,期望通过提高计算效率达到“2020年,一天内完成基因数据的收集、分析和解释”的愿景。
举报电话:01058302828-6823
发表评论
用户名:
密码:
验证码:
匿名发表

相关文章
    无相关信息
 > 电子杂志 > 迷路的移动 > 医疗创芯