案例基本内容和执行情况
本项目针对数据要素流通中的数据安全和隐私保护等问题,突破了联邦学习与多方安全计算混合引擎架构、密态数据联合统计与建模、基于指令集加速的高性能分布式联合计算、高性能安全对齐和匿踪查询算法、隐私计算互联互通数据和算法模块标准化等关键技术;形成了一套可信隐私计算技术体系,研建了基于隐私计算的可信数据要素市场共享平台,包含至少10种联邦特征工程算法、10种匿踪联邦算法,实现联邦模型评估算法,输出至少20种模型评估指标项,实现数据可信高效共享与数据隐私保护;并形成了标准化的隐私计算算法协议互联互通框架和跨平台隐私计算互联互通管理系统,支持千万级数据的可信互联互通,数据交易金额达到千万元级。本项目研究成果面向金融、政务领域开展了应用,向大型数据交易中心、金融机构等提供服务,解决了政府、金融机构、企业间跨域数据融合和隐私保护等问题,实现了数据价值的可信流转和共享,推动我国数据要素市场安全规范地运行。
案例主要经济成效和社会成效分析
(1)经济成效:本项目通过可信数据要素市场共享平台的应用,解决了政府、金融机构、企业间跨域数据融合问题,保障了信贷风险联合监测、跨机构黑名单共享等业务的安全性、高效性,有效避免多头借贷、票据欺诈、洗钱等金融风险;减少损失在千万元级别。项目建立数据要素市场规范与隐私保护体系,将规范与体系推广应用于全领域场景,成果转化合同或协议数预计超过15个,销售额超过千万元,经济效益显著,有望成为我国数据要素市场隐私保护应用模式革新的成功典范。
(2)社会成效:项目依托区块链与数据安全全国重点实验室、区块链安全与平台技术教育部工程研究中心、大数据联合计算中心等国家及省部级科研平台,以产学研用强强联合的方式凝聚优势互补的技术队伍,开展科技创新活动,推动我国和我省在数据要素市场的创新发展。通过突破数据要素可信共享关键技术,构建数据要素市场生态,依托行业龙头机构开展大规模应用验证示范,设计制定隐私计算算法协议原语定义规范,突破隐私计算互联互通数据和模块标准化技术,推动数据要素与实体经济的深度融合,根据可信隐私计算技术体系合理性、安全性和有效性的测试验证结构,有效指导我国和我省数据要素市场可信共享技术发展及产业化落地。具体如下:
1)通过可信数据要素市场共享平台研建,推动数据要素与隐私计算深度融合,构建数据要素可信共享生态环境;
2)汇聚高校、研究机构和产业化团队等开展协同攻关,突破隐私计算前沿技术和具有国际竞争力的关键和新型技术,在隐私计算领域培育一批能够覆盖前沿理论、工程技术、系统测试和产业应用的人才队伍,孵化具有国际影响力的自主创新科研团队与企业,为金融、政务等领域的数据要素应用创新提供人才保障,为我国数据要素战略提供坚实有力的平台和人才支撑。
好文章,需要你的鼓励
华中科技大学与利哈伊大学研究团队开发的MMMR基准是首个专门评估多模态大语言模型推理思考过程的综合工具。通过1,083个跨六大领域的高难度推理任务和创新的推理过程评估管道,研究发现即使最先进的模型在推理任务上也与人类存在约10%的差距。研究揭示了答案准确性与推理质量间的脱节:模型常出现思考不一致(41.5%)、过度思考(20.5%)等问题。这一基准不仅评估答案正确性,更深入分析思考质量,为提升AI系统的可靠性和透明度提供了重要方向。
UI-Genie是一个创新的自我改进框架,解决了GUI智能体面临的两大挑战:轨迹验证困难和高质量训练数据缺乏。研究团队开发了专用奖励模型UI-Genie-RM,采用图像-文本交错架构有效处理历史上下文,并统一了步骤级和任务级奖励评估。通过精心设计的数据生成策略和迭代自我改进,该框架无需人工标注即可创建高质量合成轨迹。实验结果显示,经过三轮数据-模型自我改进后,UI-Genie在多个基准测试上达到了最先进水平。该研究已开源全部实现和数据集,为GUI智能体研究提供重要资源。
浙江大学和蚂蚁集团的研究团队开发了ACTIVE-O3,一种创新框架,赋予多模态大语言模型"主动感知"能力,使AI能够智能地决定"看哪里"和"怎么看"。基于群体相对策略优化(GRPO)构建,该系统采用两阶段策略,先选择关注区域,再执行任务。实验表明,ACTIVE-O3在小物体检测、密集物体定位和交互式分割等任务上显著优于现有方法,并展示出强大的零样本推理能力。该研究为AI系统提供了更接近人类认知的视觉探索能力,对自动驾驶、医疗诊断等领域具有重要应用价值。
ImgEdit是北京大学与兔小贝AI联合推出的图像编辑框架,解决了开源编辑模型落后于商业产品的问题。该框架包含120万对高质量编辑图像对,涵盖13种编辑类型和11万个多轮交互样本。通过融合视觉语言模型、检测模型和分割模型的多阶段流程,ImgEdit确保了数据的高质量性。研究团队基于此数据集训练了ImgEdit-E1模型,并提出ImgEdit-Bench评估基准,从指令遵循、编辑质量和细节保留三个维度全面评估模型性能。实验结果显示,ImgEdit-E1在多个任务上超越现有开源模型,推动了图像编辑技术的进步。