ZD至顶网CIO与应用频道 05月06日 北京消息(文/王聪彬):今年的Teradata的大数据峰会又如期而至,每年探讨的主题当然也是围绕着大数据的价值,但是现在数据上也有了更多的新趋势,深度(更敏捷的数据)、宽度(融合内外部资源)、跨度(跨行业的脱敏数据使用)。Teradata大中华区首席执行官辛儿伦也表示,为了更有效的满足这三个维度的需求,也就有了今年的新主题“数据仓库 开源融合 极致演绎”。
Teradata大中华区首席执行官辛儿伦
辛儿伦同时总结了影响着大数据的使用的“三度两性一量”,包括结构度、精确度、敏捷度、关系性、易用性、含金量。所以这也就意味着目前无法用一个平台解决所有需求,Teradata的生态提供了分析生态系统,分析解决方案,以及客户选择和灵活性,专注帮助客户将数据发挥最大价值这一件事做到极致。
大数据已经谈了10年,Teradata首席技术官宝立明表示,现在已经进入到第四维度“数据发现”,一切数据都可以分析。尤其是传感器的数据分析让之前的数据价值都变的非常渺小,因为传感器能实现对万物的数据收集。
同时还有一个很大的变化是现在数据的重心正在转移到云中,因为随着业务系统转移到云端,分析也将转移到云端。
Teradata首席技术官宝立明
Think Big上个月正式在中国发布,时隔一个多月Think Big创始人兼总裁Ronald Bodkin也首次亮相中国,他认为数据量不是最重要的因素,多样性是关键。数据湖是一种逻辑上的概念,数据湖新的分析方法可以使得建立一些复杂产品。
Think Big创始人兼总裁Ronald Bodkin
作为Teradata的客户,美国富国银行拥有7000万+客户,8643家网点,虽然拥有众多的客户和网点,但美国富国银行副总裁刘维政却说我们每次看到这些数据都很担心这些客户会流失。银行在大数据上大多是传统的统计,不是动态的,银行需要了解顾客行为的变化。
沃达丰德国BI战略、商业架构及组合管理主管Michael Hansen则展示了沃达丰创建的一个集商业、技术架构和运营模式一体并不断优化进行价值创造的综合蓝图。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。