至顶网CIO与应用频道 06月23日 北京消息:2017年6月16日,以“大数据视野下的数字丝绸之路”为主题的“中国东南大数据智能应用峰会暨数据中国城市行”活动,在福州隆重举行。此次峰会邀请到包括普元信息在内的中国大数据50强企业以及中国大数据产业生态联盟理事会员单位百余家优秀企业赴榕参会,旨在更好地凝聚区域发展优势,推动大数据在福州的应用创新和落地。
普元信息大数据产品交付总监王鹏作为全国大数据50强企业代表之一出席此次峰会,与福州市政府签署中国大数据50强企业落地福州倡议书。倡议书中提出,中国大数据50强企业将与福州市人民政府共同运用大数据先进理念、技术和资源,加快福州大数据应用落地,推动大数据企业和项目优先落户中国东南大数据产业园,并承诺,双方将共同打造面向交通、教育、旅游、医疗、养老、位置等重要民生服务领域的大数据行业应用平台,带动形成一批全国领先的行业大数据应用解决方案。
第二排右二为普元信息大数据产品交付总监王鹏
普元信息作为中国大数据产业生态联盟副理事长单位、中国大数据50强企业,将在联盟的带领下,与联盟成员单位一同与地方政府管理者和对大数据有迫切需求的地方用户进行深度对接,带动大数据与各行业领域的紧密融合,聚焦大数据智能应用场景用科技助力数字丝绸之路建设。
多年来,数据问题一直限制着企业数据平台的发展,数据治理备受关注,普元专注于大数据治理,从企业数据资产管理和提升数据质量,到自服务和智能化的数据应用,普元大数据治理技术在不断地发展和完善。目前,普元聚焦以用户为中心的自服务大数据治理,通过信息梳理、数据管控、连接用户、智能化实现自服务大数据治理,降低企业开展大数据管理的难度。
在历行超10年的大数据治理践行中,普元信息已为包括政府、金融、能源、电信、制造等在内的众多垂直产业客户提供差异化大数据治理方案:帮助苏州工业园区实现“三库、三通、九枢纽”建设;帮助浙江电力数据打造自助化分析平台;帮助东方航空加速业务数据地图业务创新过程,在大数据商用领域进行了积极的布局和探索……
普元大数据治理技术地图
7月至9月,普元信息主办的PWorld 2017系列技术活动将展开,将有六场大数据主题技术活动,其中7月1日的PWorld MeetUp现已开放报名,在北京、广州共话“人工智能大数据自助发现”。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。