ZD至顶网CIO与应用频道 04月08日 北京消息:数据无处不在,并记录着我们的一言一行。
根据中国互联网络信息中心发布的统计报告,截至2015年12月,中国网民规模已达6.88亿,其中使用手机上网人群占据90.1%。
移动互联的快速兴起,个体以及社会应用产生的数据已经开始爆发,比如社交、交互式应用带来了大量的网络数据,包括网络日志、电话记录、医疗记录、传感器和监控数据等,这些数据充斥在我们周围,来源各异,类型不同,规模庞大。
同样的情形也发生在行业领域,IDC预测,2020年全球数据总量将超过40ZB,其中80%为非结构化数据。一直以来,除了堆砌在存储系统中,数据本身所蕴藏的商业价值往往被忽视,没有有效的挖掘出来。但是随着越来越多的商业智能化应用初露端倪,也让更多的企业看到了数据中潜藏的巨大机遇。
在零售业,ZARA、H&M这样的公司正大量依赖客户数据,通过强大、全新的分析技术,实时洞悉时尚前沿,保持竞争力。
在保险和汽车行业,新型遥感探测技术可提供有效信息,使管理者能够更具体地评估驾驶行为,并将此信息应用于政策定价和汽车设计。
这样的变化几乎每天都在发生,比如利用大数据技术对用户的行为习惯进行分析,运营商能更有针对性地制订市场营销计划,或者开发出更多全新的商业模式和服务;通过分析在金融机构之间交换的交易数据,金融行业能确保交易的安全可靠,防止欺诈发生;借助大数据技术,智能城市及物联网领域则更快实现对交通、公共安全、气象和污染变化的智能监控及预测……
行业数字化转型背后的大数据运营
顾名思义,“大数据”首先是数据量很大,已经从TB级跃升至PB甚至到EB级;其次区别于传统的数据结构和类型,数据结构和类型更加复杂,比如网上的流媒体数据、物联网中RFID感应数据以及社交网络上产生的各种数据等。
尤其随着非结构化数据持续不断地增加,并且需要长时间存储,非热点数据也会被随机访问,这种情况与传统的、基于关系型数据库的核心数据存储方式有显著的差异。这种差异使得传统的数据存储和管理解决方案无法胜任大数据时代的分析、管理和挖掘工作。
此外,因为数据每时每刻都在产生,传统解决方案也无法适应这种近乎无限的扩张性。为了适应大数据时代,企业需要从硬件、技术、应用等各个层面做好准备,才能满足大数据收集、存储、管理和分析的要求。
在数据规模上,能够支持PB级甚至更大规模的数据,在数据类型上,支持非结构化以及结构化数据,速度上支持每秒万次级查询,并拥有更高的系统可靠性以及更高的统计分析效率。
除了支持更快速、灵活及稳定的分析挖掘,对数据的存储和统一管理能力也必不可少,在应对大数据处理难题面前,硬件和软件都将发挥自身的价值,因为要实现大数据的高效分析和挖掘,除了高性能、可靠的硬件平台,软件层面的优化支持也更为关键。
重塑数据价值
预计到2025年,全球将新增40亿互联网用户、80亿智能手机在使用、联接数将达一千亿、每人每天消费1.7GB数据、移动支付将达到3万亿美元……滚滚数据洪流将深刻地影响到每一个行业、每一个组织、每一个人。
在万物互联的全联接时代,核心是“突破时间和空间的全连接和零距离”和“基于数据的智能和智慧”。用户体验将从独立的应用体验,过渡到数字世界和物理世界互动、融合的集成体验。在此环境下,企业需要更加贴近最终用户,注重用户的体验和感受,并与用户进行交互。其背后需要企业的商业模式、营销模式、研发模式、运营模式、服务模式等全方面改变,更离不开IT基础设施本身的重构以及支撑。
毫无疑问,数据已经成为数字经济的命脉,行业数字化转型的引擎,以及商业竞争中最宝贵的资源,企业的成功越来越依赖于对数据的管理和价值挖掘。华为在2016分析师大会上将重磅宣布数据治理愿景,帮助企业重塑数据价值。
业务创新正在驱动数据治理架构重构,在华为数据治理的宏大愿景下,数据治理的边界正在无限延伸,华为围绕数据全联接、敏捷数据服务、开放共赢生态持续构筑竞争力,为各行各业提供洞察,帮助企业迅速把握商业先机,同时构建企业主导的数据治理生态。
重塑数据价值,洞察企业数字转型的新机遇!
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。