至顶网CIO与CTO频道 02月06日 编译:当前,医疗成本、处方药价格以及售价透明度等层面已经出现激烈的市场竞争,但问题并未表现出任何得到解决的短期可能性。也许接下来的头条新闻会报道与此相关的某些细节议题,但身处医疗保健领域的从业者已经普遍意识到,一场规模更大的医疗资产争夺战即将打响数据——数据将如同石油之于世界一样,在医疗领域成为新的血液。
最近几周以来,亚马逊与谷歌分别公布了拓展医疗保健业务的计划。两大技术巨头都希望通过高级分析、机器学习技术以及云功能解决方案给整个行业带来颠覆。例如,亚马逊方面正尝试引入一种转录工具,能够将患者与医生之间的口头对话记录下来,将其中的详尽信息翻译为文本,并以摘要的形式将信息记录在医生的电子健康记录(EHR)系统之内。
在另一方面,谷歌公司则着手开发一款搜索工具,能够将人工智能(AI)应用于患者的临床数据,并就治疗规划、处方以及诊断结论等给出建议。根据《华尔街日报》的一篇报道,作为与Ascension卫生计划的部分合作项目,谷歌已经从全美2600多家医院处收集到“数千万份”病历。
可以肯定的是,任何能够帮助临床医生更好、更快完成工作的技术,都代表着可喜的进步。但是这里我要向大家澄清一点,近期之所以众多科技巨头纷纷进军医疗保健领域,其中的真正原因在于:他们已经意识到如果想要收集“数千万份”医疗记录,那么下手最好是快一点。换句话说,只有与现有医疗体系以及从业者保持一致,他们才有机会掌握丰富的临床患者数据,从而建立起行之有效的全新数据发展战略。
然而,要想获得临床医生们的支持,科技企业首先需要摸清对方的底线:医生们如何利用数据,以及坚定反对哪些其他数据利用方式。
给医生们的数据
根据我的个人经验,医生们对数据的需求量并不算大。随着电子病历的广泛采用,临床医生面对的数据其实有点过量,而且其中相当一部分属于难以访问或者解释的非结构化护理相关数据。结合这一背景,临床医生们想要的显然不是进一步增加数据量,而是如何以真正易于操作的方式从中提取洞察见解,并据此改善患者护理能力。
例如,亚马逊提供的语音到文本转录平台等工具能够帮助医生轻松记录下患者的实际体验,将护理位置处的反馈实时转化为可靠结论。但是,如果捕捉到的数据无法保存为合理的格式,那么其仍不可能被用于支持临床决策。在这样的前提下,临床医生必然会被迫将大量时间浪费在信息探索中,并因此感到无比沮丧。
如果企业希望充分发挥临床数据中蕴藏的潜能,那么解决方案开发者必须明确临床医生是怎么做的、又绝对不会怎么做。例如,检查糖尿病患者的工程师需要获取患者的“糖尿病视图”,其中包含所有患者糖尿病相关病史的快照,这种简洁明确的内容将帮助他们彻底告别从大量过往临床记录中查找重要数据的窘境。只要医生们能够在与病患接触的过程中快速访问这些明确且井井有条的信息,其临床决策能力也将得到显著增强。
经验丰富的临床医生在提供诊断与治疗方法建议时,几乎不太需要翻阅患者的病历档案。事实上,出色的医生拥有足以超越任何检查科室内先进计算机的灵活大脑。正因为如此,医疗IT供应商才需要在解决方案的开发与交付过程中充分考量临床医生的思维与工作方式,只有这样开发成果才有可能真正实现生产力提升。
改善护理能力:在正确的时间利用正确的数据
下面,我们以菲尼克斯儿童医院为例,了解这里的医生们如何利用临床数据改善患者预后能力、增强文档记录并提高生产效率。临床医生们会使用针对特定医疗条件定制而成的模板——即使面对患有复杂疾病的患者,他们也能够快速且全面地记录自己遇到的所有状况。由于文档以结构化格式存储临床数据,因此医生可以轻松将重要的患者信息上传至商务智能以及分析平台,并据此创建出基于特定疾病的直观仪表板。
菲尼克斯儿童医院的医生们能够在护理过程中随时查看临床仪表板,在这里查询面向患者群体乃至个别病患的直观表示信息。此外,临床医生还可以使用这套仪表板精确跟踪各位患者的病情,这一点在照料患有慢性疾病的儿童患者时非常重要。通过在正确的时间获取正确的数据,医生将得以制定出高质量的诊疗计划、改善临床决策并提升对患者的护理与治疗效果。
实现成功的关键
时至今日,越来越多大规模高科技企业正逐步进军医疗保健行业,并希望通过自身努力夺取更多患者数据。在我看来,为了赢下这场数据争夺战,各大科技公司必须将方案设计思路与医护工作者统一起来,专注于利用方案产出解决医疗保健领域的各项最大挑战——包括患者数量管理、消除医疗制品、扩大医疗服务范围以及缓解临床医生倦怠感等等。最终,各大科技巨头必须考虑医生这一最终用户群体的实际需求,为存在缺陷的现有技术提供替代性方案,同时延续行之有效的现有解决方案。只有将种种举措结合起来,技术巨头才能真正打造出令医护人员满意的解决方案,最终带来患者能够切身感受到的护理水平提升。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。