至顶网CIO与应用频道 06月06日 北京消息:6月4日,在第二届大数据产业峰会(BDIC 2019)上,中国信息通信研究院、大数据技术标准推进委员会发布了《数据资产管理实践白皮书(4.0版)》(以下简称《白皮书4.0》),广受业界关注。作为中国通信标准化协会的会员单位,普元数据资产管理专家团队深度参与了《白皮书4.0》的研讨修订,切实为企业提升数据管理能力提供了有益参考。
据悉,《白皮书4.0》在去年12月发布的《白皮书3.0》版本基础上更新迭代,始终站在企业的角度围绕全面盘点数据资产、不断提升数据质量、实现数据互联互通等角度,生动剖析了数据资产管理的重要内容及目标,提供了开展数据资产管理的实践步骤及模式,切实帮助企业高效开展数据资产管理。同时,《白皮书4.0》也参考国内外数据资产管理理论框架,基于DAMA(国际数据管理协会)中定义的企业数据管理架构,总结了各行业数据资产管理痛点难点、实施路径、资产管理现状与发展趋势等,并提供了优秀的数据资产管理案例,有利于指导企业数据资产管理平台搭建,提高数据资产管理效益。
在2018年《白皮书3.0》的编写过程中,普元大数据产品线总监刘庆会就曾担任编委,提供了以“盘、规、整、用”提高数据应用效益的思路,参与了重要章节的编写。在今年《白皮书4.0》的制定中,刘庆会再次担任编委,与普元专家团队共同围绕新增“数据服务管理工具”一节进行精心编撰,为这部数据资产管理领域的经典之作贡献力量。
普元认为,数据资产管理自上而下建设策略具有“规范、标准先行”的显著特点,项目通常由数据资产管理咨询项目开头,包含调研数据资产分布现状、评估数据资产管理水平、建设数据资产管理体系等重要活动。数据资产管理自下而上建设策略则具有“问题导向、系统建设先行、快速见效”的显著特点,使用成熟的数据资产管理工具,快速搭建数据资产管理平台,完成企业的元数据管理、数据质量管理两项核心数据资产管理任务,以及数据模型管理、数据标准管理、数据安全管理等其它数据管理职能。
作为国家企业技术中心,普元十分注重在大数据领域发展,加入全国信息技术标准化技术委员会大数据标准工作组成员单位、中国通信标准化协会成员单位,参与相关国家标准制定,承担了国家部委的多项重点科研课题项目。同时,普元还凭借在大数据领域的技术优势,入选成为“中国大数据产业生态联盟”首批理事单位,并享有“中国大数据企业50强”殊荣。在本届大数据产业峰会上,也凭借“数据资产管理平台(Primeton DGP)”获得了星河奖“优秀大数据产品奖”。
在大数据领域,普元已先后帮助金融、电信、电力、能源、航空、制造等诸多行业管理数据资产,为全国各地数百家知名客户带来业务价值。随着企业数字化转型的加快,普元将以面向数据治理的大数据应用平台,为用户获得数据、使用数据、数据落地和数据安全提供更加完善的解决方案。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。