数据科学里的“坑”:企业为何无法充分发挥数据科学的力量

数据科学非常强大,也吸引到各类组织的积极投资。然而,鲜有使用者能够充分发挥数据科学的潜力。

在新冠疫情最严重的时期,全球面临的严峻挑战之一就是如何及时将疫苗分配给需求最迫切的地区和群体。跟其他国家一样,意大利也在努力解决这个令人望而生畏的难题。意大利某城市决定引入门户网站,跟踪整个供应链中所有疫苗的流动情况,尽可能快速向100万居民提供疫苗。利用这些数据,该系统自动将疫苗分配给运输中心,并自动为公民设定预约时间——整个流程成为当地疫苗接种计划的基石。但就是在这样一个典型的需求场景下,AI解决方案从未得到大规模使用、自然也就无法提供真切的价值回报。为什么会这样?

数据科学无法解决具体问题的情况绝非个例。哈佛大学创新科学实验室的研究表明,在汽车、生物技术、零售和公共事业等众多领域当中,只有少部分数据科学项目能够解决挑战、成功带来规模化绩效提升。至于难以成功的理由,研究人员总结出数据科学中的四大“坑”,那座意大利城市显然就是不慎掉了坑。

缺乏具体的、待解决的强相关问题

很多数据科学工作在启动之初,都缺少一个可供数据科学家把握待解决问题的适当框架,导致这些才华横溢的研究者只能把自己的技术用于过分广泛、大多与用户无关的问题。数据科学家们的创新过程大多与倾听用户需求无关,而是以运行回归为起点。很明显,他们真正需要的是清晰简洁的问题框架,确保设想的解决方案与最终用户始终具有强相关性。

那座意大利城市就是个很好的例子。他们面对的主要挑战并不在技术,而是缺乏对于待解决问题的具体定义。由于没有关于用户相关性的清晰指引,数据科学家们最终只能构建起一个复杂的指标仪表板,但仍然没法明确回答怎样才能高效将疫苗分配至接种地点。有趣的是,该门户倒是很好地解决了疫苗到期日管理和配送车队管理等相关问题——虽然这些都是次要问题,但由于需求清晰,所以可谓迎刃而解。

当用户们(包括当地政府的工作人员、医生、护士和志愿者等)发现新门户解决不了自己面临的最大挑战时,他们只能继续依靠旧的手动Excel电子表格进行计算,重复那费时费力的工作进程。

技术易用性差

即使已经拥有了定义明确、有针对性的相关问题,数据科学团队也想办法找到了解决思路,但如何让外行用户也能访问和把握这些见解又成了新的挑战。在采用AI解决方案时,很多技术团队都忽视了以用户为中心、强调设计思维和其他一些看似简单的要素(例如高质量的用户体验/用户界面)。

意大利疫苗分配AI的用户界面也有问题:用户不仅难以理解这套方案的设计目标,而且界面上只显示出一大堆数字,根本看不出其各自从何而来。虽然人人都知道这些数字就是以往那些Excel表格中不同项目的计算结果,但用户还是倾向于放弃效率、继续沿用之前的老办法,毕竟如今的AI驱动工具太不透明、让人不敢放心使用。通过这个痛苦且昂贵的教训,可以看到AI解决方案的可用性甚至高于模型准确性。

总部位于美国的奢侈品时尚控股公司Tapestry旗下拥有Kate Spade、Coach和Stuart Weitzman等多个品牌,他们意识到向数据科学引入更多设计驱动思维才是获得成功的关键。以往,配送中心的产品分配是通过简单算法引导的,但最近已经被替换为具有更高预测精度的机器学习模型。可公司发现,尽管新模型效能更佳,但配送人员还是经常选择旧模型。造成这种情况的一大关键原因,就是可用性太差。Tapestry公司数据科学副总裁Fabio Luzzi解释道,“与很多企业一样,数据科学和配送团队在日常工作中的交流方式和思考重点完全不同。人家那边聊的经常是风格和颜色,但我们这边却只讨论数学,这就导致初步解决方案根本不适合目标受众。后来,我们开始深入探寻配送部门的认知过程,并最终建立起以人为本的价值取向。”Luzzi和他的团队发现,配送人员只需要看到特定几个数字,而且各个数字之间最好以强关联形式进行排布。而一旦数字或布局发生变化,他们的例行流程就会受到影响,导致工作人员迷失方向、无法高效配送。Luzzi总结道,“我们意识到,只有充分符合用户习惯的方案,才是行之有效的方案。在引入这个基本判断之后,我们的方案得到了广泛采用,并最终拉升了配送中心的运作绩效。”

数据科学技术在产品团队乃至整个组织内整合度不佳

另一个大麻烦,就是数据科学团队往往始终在真空中工作——即只专注自己手头的技术任务,陷入“懂的都懂”、自说自话的无意义狂欢。事实上,数据科学对其他部门的嵌入才是关键,要确保数据科学渗透到整个企业和各部门间的边界位置。与此同时,也要为数据科学家们提供完整的工作指引,提醒他们技术成果的最终目标是为产品做出贡献。总之,代码开发只是手段,产品开发才是目的。

轮胎制造商倍耐力就非常了解这一点。作为一家年收入超过50亿美元的企业,他们的数字化转型旨在由当前的B2B向B2B2C商业模式转变。其中之一就是配备传感器的智能轮胎,由此产生的数据将帮助倍耐力为汽车制造商和车队提供信息服务,由此拉近与最终客户间的距离。要实现这个目标,倍耐力必须在公司内部建立起数据驱动型文化,允许各个部门有权采用自己的数据科学方法。各部门须指派一名数据管理员,并作为中央团队的单点联络人。如此一来,倍耐力就能在各个部门的最终用户中建立工具,避免为了构建模型而构建模型。此外,这种组织结构还有助于打破不同部门间的边界,专注于将改进最终产品的愿景统一起来,打破组织和数据孤岛、加快积极成果的应用速度。

缺乏帮助人们熟悉新解决方案的意愿和努力

最后,当解决方案准备就绪之时,很多组织并没有预留下充分推广新方案的必要时间,导致团队对其不够熟悉、用户也不清楚这有何价值。先要明确一点:这些尚未被正式采用的解决方案缺乏用户信任,他们更愿意坚持自己熟知的工作方式。很多数据科学工作就是到这个阶段才陷入失败的,可以说前面各个环节的大量资源投入已经完成,因此差这临门一脚就格外令人惋惜。意大利城市的疫苗分配优化也有这个问题,用户根本不知道怎么在新的门户中导航和操作,缺少主动使用的动机和意愿,于是最终还是回归之前用惯了的分配表。

再来看倍耐力公司的制造部门。现在,该部门已经在利用易于操作的算法模型取代之前的Excel模型,借此估算新产品的工业产量。为了向用户展示AI技术的好处,倍耐力比较了新旧两种模型在盈利能力和产量预测方面的准确性水平,向团队证明新方法确实能提供更好的洞察力,同时也凭借更棒的用户界面和体验提高了员工的工作效率。

倍耐力数据科学与数据管理负责人Daniele Petecchi表示,“从高管人员到运营同事,无论最终用户是谁,只要他们无法顺畅上手,那解决方案就已经失败了。只有在人们相信解决方案能够提供价值并可靠交付价值的情况下,新成果才有可能被实际使用。神经网络绝对不是终点,真正的终点是帮助人们轻松完成工作、创造更好的产品。所以先要在人与方案之间建立起信任,这样之前付出的一切才会有意义。”

建立以数据为中心的组织不仅需要高质量算法,还需要定义待解决的正确问题,确保解决方案易于使用、将方案渗透到整个组织内的各个正确位置,并动员人们信任这种新方案。

在组织的数字化转型过程中,AI解决方案的设计、部署、对业务问题的解决以及如何为用户提供明确的价值回报,一直是必须面对的现实难题。希望建立以数据为中心的组织、甚至是AI工厂的领导者们需要意识到,这种转型并不仅仅体现在技术能力之上,更体现在数据质量、代码质量、数据隐私和机器学习算法的训练复杂度等环节当中。总结来看,决定转型成功与否的因素并不难理解——哪些问题被解决后能给用户带来显著的价值回报,就去解决哪些问题;确保所部署技术拥有良好的易用性;建立渠道,帮助数据科学渗透整个组织,也让数据科学家理解自己的方案是如何在团队手中发挥效力、产生价值的;还有最后,引导使用者对这些解决方案产生信任感。只要成功回避文章开头提到的四大“坑”,相信您的数据科学转型之旅将很快进入轨道、一路高歌猛进。

来源:至顶网CIO与CTO频道

0赞

好文章,需要你的鼓励

2022

11/11

10:30

分享

点赞

邮件订阅