ZD至顶网CIO与应用频道 04月08日 北京消息:数据无处不在,并记录着我们的一言一行。
根据中国互联网络信息中心发布的统计报告,截至2015年12月,中国网民规模已达6.88亿,其中使用手机上网人群占据90.1%。
移动互联的快速兴起,个体以及社会应用产生的数据已经开始爆发,比如社交、交互式应用带来了大量的网络数据,包括网络日志、电话记录、医疗记录、传感器和监控数据等,这些数据充斥在我们周围,来源各异,类型不同,规模庞大。
同样的情形也发生在行业领域,IDC预测,2020年全球数据总量将超过40ZB,其中80%为非结构化数据。一直以来,除了堆砌在存储系统中,数据本身所蕴藏的商业价值往往被忽视,没有有效的挖掘出来。但是随着越来越多的商业智能化应用初露端倪,也让更多的企业看到了数据中潜藏的巨大机遇。
在零售业,ZARA、H&M这样的公司正大量依赖客户数据,通过强大、全新的分析技术,实时洞悉时尚前沿,保持竞争力。
在保险和汽车行业,新型遥感探测技术可提供有效信息,使管理者能够更具体地评估驾驶行为,并将此信息应用于政策定价和汽车设计。
这样的变化几乎每天都在发生,比如利用大数据技术对用户的行为习惯进行分析,运营商能更有针对性地制订市场营销计划,或者开发出更多全新的商业模式和服务;通过分析在金融机构之间交换的交易数据,金融行业能确保交易的安全可靠,防止欺诈发生;借助大数据技术,智能城市及物联网领域则更快实现对交通、公共安全、气象和污染变化的智能监控及预测……
行业数字化转型背后的大数据运营
顾名思义,“大数据”首先是数据量很大,已经从TB级跃升至PB甚至到EB级;其次区别于传统的数据结构和类型,数据结构和类型更加复杂,比如网上的流媒体数据、物联网中RFID感应数据以及社交网络上产生的各种数据等。
尤其随着非结构化数据持续不断地增加,并且需要长时间存储,非热点数据也会被随机访问,这种情况与传统的、基于关系型数据库的核心数据存储方式有显著的差异。这种差异使得传统的数据存储和管理解决方案无法胜任大数据时代的分析、管理和挖掘工作。
此外,因为数据每时每刻都在产生,传统解决方案也无法适应这种近乎无限的扩张性。为了适应大数据时代,企业需要从硬件、技术、应用等各个层面做好准备,才能满足大数据收集、存储、管理和分析的要求。
在数据规模上,能够支持PB级甚至更大规模的数据,在数据类型上,支持非结构化以及结构化数据,速度上支持每秒万次级查询,并拥有更高的系统可靠性以及更高的统计分析效率。
除了支持更快速、灵活及稳定的分析挖掘,对数据的存储和统一管理能力也必不可少,在应对大数据处理难题面前,硬件和软件都将发挥自身的价值,因为要实现大数据的高效分析和挖掘,除了高性能、可靠的硬件平台,软件层面的优化支持也更为关键。
重塑数据价值
预计到2025年,全球将新增40亿互联网用户、80亿智能手机在使用、联接数将达一千亿、每人每天消费1.7GB数据、移动支付将达到3万亿美元……滚滚数据洪流将深刻地影响到每一个行业、每一个组织、每一个人。
在万物互联的全联接时代,核心是“突破时间和空间的全连接和零距离”和“基于数据的智能和智慧”。用户体验将从独立的应用体验,过渡到数字世界和物理世界互动、融合的集成体验。在此环境下,企业需要更加贴近最终用户,注重用户的体验和感受,并与用户进行交互。其背后需要企业的商业模式、营销模式、研发模式、运营模式、服务模式等全方面改变,更离不开IT基础设施本身的重构以及支撑。
毫无疑问,数据已经成为数字经济的命脉,行业数字化转型的引擎,以及商业竞争中最宝贵的资源,企业的成功越来越依赖于对数据的管理和价值挖掘。华为在2016分析师大会上将重磅宣布数据治理愿景,帮助企业重塑数据价值。
业务创新正在驱动数据治理架构重构,在华为数据治理的宏大愿景下,数据治理的边界正在无限延伸,华为围绕数据全联接、敏捷数据服务、开放共赢生态持续构筑竞争力,为各行各业提供洞察,帮助企业迅速把握商业先机,同时构建企业主导的数据治理生态。
重塑数据价值,洞察企业数字转型的新机遇!
好文章,需要你的鼓励
YouTube开始推出肖像检测工具,帮助创作者识别和举报使用其面部特征的AI生成视频。该系统类似于版权检测机制,目前处于测试阶段,仅向部分创作者开放。用户需要提供政府身份证件照片和面部视频来验证身份。系统会标记疑似包含用户肖像的视频,但无法保证100%准确识别AI内容。YouTube将根据多项因素决定是否移除举报的视频。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。
谷歌宣布在AI Studio平台中引入"氛围编程"体验,让编程和非编程用户都能更轻松地开发应用程序。用户可通过简单提示生成可运行的应用,新功能包括应用画廊、模型选择器、安全变量存储等。平台还添加了模块化"超能力"功能和"手气不错"按钮来激发创意。完成的原型应用可一键部署到谷歌云运行平台。此次更新正值业界期待谷歌即将发布Gemini 3.0大语言模型。
中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。