ZD至顶网CIO与应用频道 05月31日 人物访谈(文/王聪彬):这是我第二次见Teradata天睿公司营销与业务拓展副总裁Mikael Bisgaard-Bohr,他一上来就迫不及待地和我分享了最近发生在他女儿身上的一件趣事。作为社交达人的女儿活跃在各大社交网站,有一天她看到Facebook的财报,不禁产生疑问,为什么提供免费服务还可以赚钱?
Mikael为女儿解释了Facebook是如何利用用户数据赚钱,女儿马上意识到未来在社交网站上上传数据需要更谨慎。这正是消费者越来越意识到数据的价值,这对于企业利用数据将是一个挑战。
Teradata天睿公司营销与业务拓展副总裁Mikael Bisgaard-Bohr
当然数据也可以帮助企业从新定义商业模式,在Teradata Universe峰会德国站,Mikael遇到的一个德国客户谈到,十年以后各个企业的CEO不能再找借口说我不知道这件事情发生了,因为数据可以将现实重现。
市场转型带来的技术与业务突破
在2013年,Teradata将市场分为美洲和国际两大部分,Mikael 负责市场营销及国际市场营销和业务拓展。在他看来虽然在三四年之前美国市场有一定的疲软,但2015年国际业务的各个市场都表现良好,尤其是中国市场增长明显。
Teradata去年财报出现了降幅,这也反映出传统数据仓库市场需求出现变化,数据分析相关需求却正在逐渐增加。Teradata同时也收购了多家公司来扩充技术实力,结合开源技术来提供更多更强大的数据分析服务,来应对市场的转型。
Mikael强调说,他们看重长期的发展,Teradata最重要的行业是金融、电信、零售三个行业,其中电信行业在过去一段时间基本已经达到饱和,但零售业由于中国地理分布的原因,在中国还有很多可以拓展的地方。
在三大行业之外,Teradata同样也在做一些新的拓展,尤其是新的增长领域,这其中很多是B2C的企业,因为他们会产生大量丰富的数据。另外,“中国制造2025”战略强调制造业的数字化转型,之前制造业客户更多是在营销和财务系统上进行投资,而现在核心生产系统的数据分析需求正是Teradata拓展的新领域。
在技术上Teradata也在改变策略,强调包容不同技术的分析生态系统,来帮助客户解决问题。同时,在技术上也会坚持创新,实现业务模式的不断突破。
数据将重新定义企业
现如今各行各业对于数据分析的理解都已经发生了改变,这也使得技术层面和业务层面都出现了一定挑战,大家都希望更好的利用数据,将数据进行变现,因为数据带来的市场机遇是巨大的。
以银行为例,五年前他们做的还是关系型数据库或者列式数据库,当数据不断的累积后,他们在想利用这些数据能解决什么业务问题?银行客户们总结了200多个可以用数据解决的新业务问题,这其中涉及了移动数据、网络数据、甚至各种各样交互产生的数据,并且查阅这些数据进行分析的人也在发生变化。
数据在电信行业也有三个趋势,第一,全渠道地整合线上线下信息,在销售前对客户有一个全面的了解;第二,根据客户相关数据来制定促销价格,因为定价将直接影响他们的损益;第三,通过数据了解供应链,客户在什么时间什么地点需要什么货品,帮助零售商控制成本。
有一个制造业客户曾向Mikael抱怨,流水线组装工人投诉没有时间上卫生间,但管理层却说不存在这个问题。最后他们通过给每个流水线上的工人配发一个智能穿戴设备(Fitbit)来收集工人信息解决投诉问题。
通过这些数据,他们还能发现流水线上工人的整个工作流程设计是否合理。例如,他们发现重型工业组装操作需要单手举起非常重的部件,然后又要弯下腰拿工具进行操作,所以这里就需要进行工作流程再造,而这都说明数据能更快速地帮助他们解决了多种问题。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。