数据现在是最有价值的企业商品之一。根据CIO.com的《2022年CIO现状》报告显示,有35%的IT领导者表示,数据和业务分析将在今年其组织IT投资中占比最多,58%的受访者表示,未来一年他们将增加对数据分析的投入。
虽然数据有很多种形式,但是最大的、尚未被开发的数据池可能是文本,不管是专利、产品规格、学术出版物、市场研究、新闻,还是社交信息流,都以文本为主的,而且文本的数量也在不断增长。根据Foundry 2022年数据和分析研究,有36%的IT领导者认为,管理这些非结构化数据是他们面临的最大挑战之一。这也是为什么研究公司Lux Research指出,自然语言处理(NLP)技术特——别是主题建模——正在成为释放数据价值的一项关键工具。
自然语言处理是人工智能(AI)的一个分支,用于训练计算机理解、处理和语言生成。搜索引擎、机器翻译服务和语音助手都由自然语言处理提供支持的。主题建模是一种自然语言处理技术,可以将一个想法分解为由词组定义的、常见概念的子类别。据Lux Research称,主题建模让企业组织能够将文档与特定主题进行关联,然后提取数据,例如某个主题随时间推移出现的增长趋势。主题建模还可以用于为给定文档建立“指纹”,然后发现具有相似指纹的其他文档。
随着企业对AI的兴趣越来越浓厚,他们开始转向利用自然语言处理来释放文本文档中的非结构化数据蕴含的价值。研究公司MarketsandMarkets预测,自然语言处理市场规模将从2022年的157亿美元增长到2027年的494亿美元,在此期间的复合年增长率(CAGR)为25.7%。
下面就让我们来看看企业组织是如何使用自然语言处理来创造业务成果的五个实例吧。
美国礼来公司:通过自然语言处理在全球开展业务
跨国制药公司礼来(Eli Lilly)正在使用自然语言处理帮助全球三万多名员工在公司内部和外部共享准确的、及时的信息。礼来公司开发了一套名为Lilly Translate的本土IT解决方案,使用自然语言处理和深度学习,通过经过验证的API层生成内容翻译。
此前的多年,礼来公司是依靠第三方人工翻译供应商来翻译各种内容的,从内部培训材料一直到与监管机构的正式技术交流内容。现在,Lilly Translate服务为用户和系统提供了Word、Excel、PowerPoint和文本的实时翻译,且保持文档格式不变。礼来公司使用生命科学和礼来内容训练的深度学习语言模型,帮助提高翻译的准确性,打造能够识别礼来特定术语和行业特定技术语言的精炼语言模型,同时保持受监管文档的格式。
礼来公司副总裁、信息和数字化解决方案信息官Timothy F. Coleman表示:“Lilly Translate涉及公司的各个领域,从人力资源到企业审计服务,再到道德和合规热线、财务、销售和市场营销、监管事务、以及许多其他领域。这节约了大量的时间,现在翻译工作只需要几秒钟,而不是几周的时间,让关键资源有时间可以集中用于其他重要的业务活动上。”
Coleman给出的建议:支持那些激情驱使的项目。Lilly Translate最初是由一位好奇的软件工程师发起的一个充满激情的项目,他的想法是解决Lilly Regulatory Affairs系统组合的一个痛点:业务合作伙伴在翻译服务方面不断遇到延迟和摩擦。Coleman与其他高管和经理们分享了这个想法和技术愿景,立即获得了礼来全球监管事务国际领导层的项目支持,后者主张对该工具进行投入。
“[这个想法]很好地结合了探索和学习新兴技术的机会,最初这是一个很好的学习机会,现在这变成了礼来软件工程师抓住并运行起来的一个很好的项目机会。”
埃森哲:使用自然语言处理分析合同
埃森哲正在利用自然语言处理做法律分析。埃森哲的法律智能合同探索(Accenture Legal Intelligent Contract Exploration,ALICE)项目帮助这家有2800名专业人士的全球服务企业在其数百万份合同中进行文本搜索,包括搜索合同条款等。
ALICE使用了“词嵌入”,一种自然语言处理方法,也就是可以根据语义相似性辅助词与词之间的对比。该模型会逐段检查合同文件,寻找关键字以确定该段落是否与特定的合同条款类型相关。例如,“洪水”、“地震”或者“灾难”等词通常与“不可抗力”从句一起出现。
埃森哲数字业务转型、运营和企业分析全球常务董事Mike Maresca表示:“随着我们持续利用这项能力并且不断对其进行增强,它的用途不断扩大,我们看到了额外的价值机会,而且我们正在寻找从现有数据中获取价值的新方法。”
埃森哲表示,该项目大大缩短了律师手动阅读文件以获取特定信息的时间。
Maresca给出的建议:不要害怕深入探索自然语言处理。“如果创新是企业文化的一部分,你就不能害怕失败,让我们放手去实验和和迭代吧。”
Verizon:利用自然语言处理回应客户请求
Verizon的业务服务保障部门正在使用自然语言处理和深度学习来自动处理客户的请求评论。该部门每个月会收到10万多个入站请求,以前,他们必须阅读这些请求并采取措施,直到Verizon的IT部门——Global Technology Solutions (GTS)——打造了支持AI-Enabled Digital Worker for Service Assurance。
这个Digital Worker将基于网络的深度学习技术与自然语言处理相结合,以读取主要通过电子邮件和Verizon门户网站发送的维修单,它会自动响应最常见的请求,例如报告当前工单状态或者修复进度更新,更复杂的问题则提交给人类工程师。
“通过自动响应这些请求,我们可以在电子邮件发送后的几分钟内而不是几小时内做出响应,”Verizon业务集团全球技术解决方案(GTS)系统工程执行总监Stefan Toth说。
2020年2月Verizon曾对外表示,自去年第二季度以来Digital Worker每月节省了近10000个工时。
Toth给出的建议:寻求开源。“环顾四周,和你的业务合作伙伴建立联系,我相信你一定会找到机会。在做出大量财务承诺之前,先考虑一下开源和实验,我们发现现在有很多可用的开源软件。”
Great Wolf Lodge:使用自然语言处理驱动的AI追踪客人情绪
医院和娱乐连锁商Great Wolf Lodge开发的Artificial Intelligence Lexicographer(GAIL)会对月度调研中的评论进行筛选,确定作者是否可能是网络水军、批评者或者中立方。
这个AI工具利用自然语言处理,对67000多条评论进行了专门针对服务行业的训练。GAIL运行在云端,使用内部开发的算法,可发现表明受访者对Great Wolf Lodge看法的关键要素。Great Wolf Lodge方面表示,截至2019年9月,GAIL的准确率可以达到95%,对于GAIL无法理解的一小部分信息,Great Wolf Lodge会使用传统的文本分析进行处理。
Great Wolf Lodge首席信息官Edward Malinowski表示:“我们希望在各个方面都能更好地与客人进行互动。”
Great Wolf Lodge的业务运营团队使用GAIL生成的洞察来调整他们的服务,目前该公司正在开发聊天机器人,用于回答客人关于Great Wolf Lodge服务的常见问题。
Malinowski给出的建议:避免为了技术而技术。要选择那些可以在技术和实用性之间取得适当平衡、并与业务目标保持一致的工具。“你必须小心什么是噱头,什么是真正解决问题的解决方案。”
Aetna:通过自然语言处理快速解决索赔
健康保险公司Aetna开发了Auto-adjudication of Complex Provider Contracts应用,用于自动阅读每份合同中有关付款、免赔额和无关费用说明的注释,然后计算定价并更新索赔。
该应用融合了自然语言处理和特殊数据库软件,以识别支付属性,构建可由系统自动读取的附加数据。因此,许多索赔申请一夜之间就可以得到解决。
该应用让Aetna的50多位索赔裁决人员把精力重新集中到需要更高层次思维的合同和索赔,以及不同医疗保险公司之间的协调工作上。
“这要归结于为最终用户提供更好的体验,”Aetna首席技术官Claus Jensen说,该软件将帮助Aetna成为医疗保健生态系统中供应商和患者的一个更好的合作伙伴。“我们要做的不仅仅是支付账单和通过电话回答各种问题。”
Aetna预计,截至2019年7月,这款应用帮助他们每年节省了600万美元的加工和返工成本。
Jensen给出的建议:缩小关注范围,慢慢来。在理想的世界中,企业会是实施能够解决很细分问题的AI。Jensen说,基础广泛的解决方案是模糊的,最终的结果是失败的,如果Aetna把通用AI应用到他们的业务中,肯定不会奏效的。此外,Aetna花了几个月的时间来检测这个过程,编写规则,测试应用。Jensen说,很多人没有耐心放慢脚步、用正确的方式做事。
好文章,需要你的鼓励
AMD CIO的职能角色早已超越典型的CIO职务,他积极支持内部产品开发,一切交付其他部门的方案都要先经过他的体验和评判。
医学生在选择专业时,应当考虑到AI将如何改变医生的岗位形态(以及获得的薪酬待遇)。再结合专业培训所对应的大量时间投入和跨专业的高门槛,这一点就更显得至关重要。
我们拥有大量数据,有很多事情要做,然后出现了一种有趣的技术——生成式AI,给他们所有人带来的影响。这种影响是巨大的,我们在这个领域正在做着惊人的工作。