案例基本内容和执行情况
依托移动云完备的云平台服务能力,云空间产品于2023年打造云原生数据服务平台,致力在大模型时代,提供海量数据存储、算力集成、数据管理等一站式数据加工作业平台。
(1)数据存储方面:支持跨云多站点存储统一纳管,依托数据处理引擎,可支持亿级元数据集中管理,数据处理响应可到百毫秒;同时基于基于数据流通行为记录,进行场景化数据行为标注,结合公有云、私有云、边缘云等多云融合技术,提供基于用户个性化行为特征的数据漫游服务,实现数据灵活调度,提升数据服务体验和质量;
(2)算力集成方面,集成数据加工引擎,当前已支持云解压缩、图片缩略图、音视频转码、相册AI等数据加工原子算力,基于存算一体、一管多存架构,实现多媒体数据在线实时秒级处理能力,同时标准化算力集成模式,支持其他数据加工原子算力的快速集成。
(3)数据管理方面:制定统一数据接入规范,统一数据语言,实现全局元数据集中管理,提供多种数据特征值算法,完成数据多维多场景标注,基于数据全局特征值,实现全局资源池数据去重,减少数据冗余存储,基于多维多场景数据标注,可实现数据图谱自构建,自动盘点数据资产,提供智能化数据管理。
(4)支持数据全生命周期管理,包括创建、修改、多版本、删除、使用等管理规范和能力,为企业提供高质量数据资产治理效能。
案例主要经济成效和社会成效分析
随着企业信息化建设进程日益深化,企业数据正成为团队生产力提升的重要抓手、企业长期发展的重要资产。
云空间通过打造企业数据服务平台,实现了企业数据资产的统一存储、集中管理、日常协同。从企业安全角度,为管理者建立了高效的数据管控手段,实现企业办公文件资产传播可控、永不丢失;从员工办公效率角度,实现了日常文件的团队共享、全局查询、数据流转。
云空间数据服务平台与基础办公应用深度互通、并支持与企业内部自建系统对接融合,整合企业全场景、全应用业务数据,跨系统存储、读取,打破应用竖井模式下的带来的数据壁垒问题,为企业生产效率提升及数字化创新奠定基础。
目前云空间已成为企业一站式数智化门户,全面助力政务、教育、党建等数十个行业低成本实现云化及数字化,促进信息化资源共享、赋能中小企业数据创新。截至23年底,云空间用户规模达97.09万人,云盘数据存储量达206.6PB,年产品总收入2.66亿元,年利润率33%。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。