ZD至顶网CIO与应用频道 03月02日 人物访谈(文/王聪彬):去医院看病,很多医生在诊断后会告诉你试试这药,如果效果不好再换药,患者可能要多次就医来实现诊疗,当然这也就达不到优质的就医体验。
精准医疗的出现则有望改变这一切,其是通过个人基因、环境与生活习惯差异考虑在内的疾病预防与处置的新兴方法。2015年1月20日,美国总统奥巴马在国情咨文中提出“精准医学计划”,希望精准医学可以引领一个医学新时代。
在中国精准医疗也已经上升为国家层面推动和市场力量主导的一个新兴行业。英特尔正在精准医疗领域展开广泛的产业合作,以计算技术为支点,通过开放、创新、协作、共赢的技术平台和生态体系来推动行业的发展。
精准医疗有挑战也有解决方案
精准医疗是一个综合学科,除了基因组学、多组学、医疗影像领域,现在还融入了高性能计算、云计算、人工智能、医疗服务、生物大数据等领域。
目前精准医疗有两大挑战,第一、数据本身,精准医疗涉及的数据都有分散化、碎片化的特点,尤其在临床领域的应用;第二、数据分析,分析效率和精准性还需要很大提升。
基因数据并不能称为大,单一类型大量数据被称为“胖数据”则更贴切。英特尔医疗与生命科学集团亚太总经理李亚东也阐述了英特尔提出的All in One Day愿景(即在2020年,一天之内完成基因数据的收集、分析和解读)。目前面临的最大技术障碍来自如何有效的汇集、存储、管理和分析大量的数据。
英特尔医疗与生命科学集团亚太总经理李亚东
2月15日英特尔发布了中国精准医疗领域的首个解决方案建议书,内容涉及创新解决方案、合作案例、参考架构推荐等。建议书围绕计算技术如何助力精准医疗行业发展展开,指出精准医疗实践需要开放、创新、协作、共赢的技术解决方案,并强调了英特尔的核心方案和价值主张,包括构建可扩展的精准医疗数据中心、精准医疗混合云平台、精准医疗分析一体机等。
未来英特尔将重点关注三个主要解决方案,第一、为精准医疗数据中心建设带来前沿技术和最佳实践,满足高通量测序数据分析对于高性能的计算、网络和存储需求,降低整体拥有成本。第二、在医院、研究机构,应用方便快捷高效的本地化数据分析方案。第三、混合云平台,同私有云合作伙伴、公有云服务商一起,为客户提供混合云架构的解决方案,服务于客户对于扩展性、灵活性和协作需求。
在系统架构设计上则主要关注软件定义基础设施和融合架构两个方向。传统的计算方式或以数据为中心的计算方式,都会用相对标准的编程模式来支撑上层的应用。本地数据中心或云数据中心都可以通过可扩展的系统框架进行支持。
而且未来人工智能在精准医疗上的应用也将逐渐深入,李亚东说,当然人工智能的大量应用还要受高质量数据、技术、算法三个因素的影响,未来在基因数据之外需要结合更多其他数据,以实现更好的辅助治疗。
合作生态进一步感知用户需求
英特尔的行业合作已经涉及到精准医疗各层面,包括医院、研究机构、基因服务提供商、云服务商等。2016年6月,英特尔发起了“英特尔精准医疗伙伴计划”,该项目面向所有对精准医疗行业及对计算创新有兴趣的单位团体,旨在促进精准医疗计算领域的方案创新、信息交换和行业交流。
此次英特尔和荣之联也共同发布了新版的精准医疗一体机。北京荣之联科技股份有限公司董事长王东辉讲述了其和传统一体机的不同之处:在底层有作业调度和存储管理软件,之上是专用算法,以及实时更新的数据库,最后是可视化工具形成完整的精准医疗一体机。
北京荣之联科技股份有限公司董事长王东辉
荣之联database.io数据库汇集了商业数据和公开数据。英特尔也有基于基因数据的数据库Genomic DB,在调度上也有Cromwell工具。李亚东认为,基因数据的运算量非常大,英特尔收购的Altera对于FPGA加速应用于精准医疗行业,带来了很好的提升。
在这个生态系统中英特尔会通过合作伙伴了解需求,目前精准医疗一体机主要面向用法相对单一的机构,例如对医院癌症相关研究进行最大的优化。
2015年建立的上海市儿童医院生物信息研究中心就是精准医疗一体机应用机构之一,合作的主要目标是把临床数据更好的应用。上海市儿童医院生物信息研究中心主任吕晖经验中看到癌症和罕见病在精准医疗领域走的相对较快,该中心通过合作一体机的使用加快了基因分析检测的速度,相信未来随着政策的出台一体机也将更广泛的应用到临床领域。
上海市儿童医院生物信息研究中心主任吕晖
另外,华大基因在数据中心、一体机、混合云三方面都同英特尔有着合作。数据中心合作在国家基因库的底层架构上,一体机合作在华大基因测序仪数据前期处理上,混合云合作在BGI Online基因组数据分析云计算平台服务产品上。
“没有一种解决方案是万能的。”华大基因股份有限公司研发中心总监、BGI Online平台负责人金鑫说,这也是我们为什么在不同场景使用不同的解决方案的原因。当然涉及临床最重要的问题就是合规,以及数据归属问题。
华大基因股份有限公司研发中心总监、BGI Online平台负责人金鑫
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。