扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNET至顶网CIO与应用频道 07月11日 编译:美国医疗保健机构BJC HealthCare目前正采用自然语言处理和文本分析技术,加快对临床研究文件的分析和整合工作。
文本分析一直是一门模糊的科学,尽管人们多年来已经在使用算法来分析词与词之间的关系,以便帮助计算机理解文档的意思,但将数据存为一种能让计算机理解并且最终用户可以查询的格式,则并非那么容易即可实现。
如今,人们在上下文分析和自然语言处理技术上已取得极大的进步,直接导入文档生成数据库可以自动标记和储存的XML文件变得轻而易举,不仅如此,最终用户还可以通过自然语言查询了解这些文件之间的关系,无需再依赖如SQL这类的传统编程语言。
其中一个较为典型的例子就是美国医疗保健机构BJC HealthCare,其有13家医院附属于华盛顿大学圣路易斯分校。据BJC HealthCare信息系统主任Tom Holdener介绍,以前为了给内容归类,该医学院的学生们需要阅读每一份相关文件。这些文件都存档于数据库当中,只有通过IT部门的帮助、使用相关工具才可对文件进行查询。
Holdener说:“你可以想象一下,这个过程有多么耗时。”
自2012年开始,BJC HealthCare与IBM共同投入开发了一个基于IBM DB2数据库的新式系统。有了该系统的支持,如今的医学研究人员可以迅速对一些情况进行判断,例如,患有某种疾病的病人有多少同时也在使用非法药物或卷烟产品,在获得这个数据后,医院将取消这些病人参加临床试验。
Holdener表示:“以往要获得这类数据,一般要花六到九个月的时间。”
其他应用案例还包括帮助医院了解分析病人再次入院的趋势情况,这种趋势分析如今已经逐渐成为新政府控制医疗保险费用的参考标准。
Holdener称,现在,不仅仅了解不同文档中关键词、短语和文章大意之间的关系变得更加简单,另一方面,曾经费尽苦心归类文档的医学院学生如今也能节省出更多时间治疗病人。
然而,虽然采用基于IBM非结构化信息管理架构的内容分析引擎已大大提高了文本分析能力,文本分析也更加注重集成企业的搜索功能,但它依然是一门模糊的科学。事实上,文本分析技术可以自动完成整个处理流程的80%到90%的工作,这也表明了进行临床研究所耗费的时间已经大大被缩短了。
事实上,IBM表示,医疗保健行业只是技术旅程的一个开端,自然语言技术和文本分析今后将被拓展应用于一个全新的领域——认知计算。例如,作为IBM智能医疗解决方案创新举动的一部分,IBM现在正与WellPoint公司展开合作,计划将文本分析和Watson超级计算机的核心功能之一自然语言处理能力,共同应用于癌症研究工作。至此,这些技术在医疗治疗领域得以更加全面的应用。
现在许多IT组织都依赖于使用文本分析来挖掘其80%的非结构化数据。尽管这些文本分析的投资回报率在不同行业差别甚大,但自然语言处理和更先进的文本分析引擎技术的结合,意味着如今技术的应用更具成本效益。
IT咨询公司Hurwitz & Associates的总裁Judith Hurwitz表示:“自然语言已经存在好几十年了,但它还没有得到广泛的应用。不过,如今这方便已经取得了很大的进步。”
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。