ZD至顶网CIO与应用频道 10月14日 人物访谈(文/王聪彬):“我们发现如今没有一种很强大的单一产品可以把全部的数据分析技术覆盖,所以现在一些数据分析越来越多是通过多种技术融合的方式来解决。”Teradata天睿公司首席分析官Bill Franks说。
Teradata天睿公司首席分析官Bill Franks
著有两本书的Bill可以说是分析界的领军人物,2013年出版了《驾驭大数据》,而两年后又出版了《数据分析变革》,这些都是他在Teradata工作13年关注到的变化。“如何让数据分析环境更加有效进行,早年间和现在的处理数据的方式迥然不同,现在的分析更关注如何把来自不同系统的数据融合在一起进行分析,这也让分析变得更加敏捷。”
由于工作非常繁忙,Bill现在已经无暇再思考第三本书的出版计划,但是他说如果有时间对内容进行策划,可能会围绕“万物皆可分析”这一主题进行进一步创作,因为可供探讨的内容实在太多。
数据分析需要多种技术融合
其实在去年Bill曾带着他的第二本书来到北京,当时我们就聊到了分析已经从普通慢慢走向了高级分析阶段。
普通分析和高级分析有什么区别?普通分析属于概述型分析,高级分析则更多是预测性分析。在五、六年前,很多企业并不具备高级分析的技能,所以大家普遍是观望状态,而现在高级分析已经成为主流的发展趋势,企业需要把它作为标配。
Bill认为高级分析就是在一个更大的框架下进行多种深入分析组合所形成的。他举例说,高级分析经常会用来分析客户行为,像客户在投诉中提到了哪些问题,需要使用路径分析、图分析等组合后得到结果,了解客户是否会流失,进而采取一些挽留措施。
而目前分析的趋势集中在多类型分析(Multi-Genre Analytics)上,它是利用多种类型的分析方法进行分析,拓展更大的价值空间。
虽然现在企业有多种类型组合分析的需求,但由于行业的不同发展程度也不尽相同,在实际应用中也有不同的难易程度。所以不同的企业会定制出自己的步骤,确定优先级,更快展现分析的效果。
除了提供QueryGrid等一些工具可以更方便地进行跨平台数据分析,帮助客户更好地迎接这些挑战外,Teradata也提供了很多解决方案去适应于不同需求。
数据分析应用空间还很大
不同行业不同企业在数据分析应用上存在一些差异,金融行业更为领先,制造行业稍稍滞后。Bill指出,现在制造行业又有了一个新的挑战,大量传感器生成的数据应该如何分析,这在之前是没有依据的。
企业的数据分析应用还存在很大的成长空间,今年Teradata在美国举办的全球用户大会上宣布提供全面、灵活的云服务支持,这也意味着即使预算有限的企业也可以尝试进行小规模的数据分析,如果行之有效再进一步扩大使用。
尤其现在一些公司在挽留客户时可以通过数据进行支撑,预测每一个客户可能的流失概率,企业可以根据0-1之间不同的概率采取相应的行动,实现更精准的决策。
中国一直是Bill非常关注的市场,他也非常看好中国市场,相比其他地区中国企业在数据分析上虽然起步稍晚,但是发展速度迅猛,而且可以借鉴全球更多的成功案例来发展出自己特色的分析。
Teradata一直在对中国的客户需求和产品解决方案进行研究,而Bill一直在关注和研究如何根据这个市场的特定需求而推出适应本地需求的产品和解决方案。他认为,总体而言全球企业对于业务需求大多是类似的,只是在部署上不同地区会存在一些差异。
好文章,需要你的鼓励
谷歌研究团队推出VaultGemma,这是其首个采用差分隐私技术的大语言模型。该模型基于Gemma 2构建,拥有10亿参数,通过在训练阶段引入校准噪声来防止模型"记忆"敏感用户数据。研究团队建立了差分隐私缩放定律,平衡计算预算、隐私预算和数据预算。尽管添加差分隐私会影响准确性,但VaultGemma在性能上与同规模非私有模型相当。该模型现已在Hugging Face和Kaggle平台开放下载。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
英国宽带服务商Olilo正式推出多千兆宽带服务,专门面向技术人员、工程师、系统管理员和家庭实验室爱好者。该公司自建Layer 2网络基础设施,提供对称多千兆宽带,支持静态IPv4地址和原生IPv6。Olilo与伦敦三大互联网交换中心建立对等连接,在英国对等网络中排名第24位。服务经过150多名技术用户的付费封闭测试,并通过Discord社区持续收集用户反馈优化服务。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。