解读华为云FusionInsight可信智能计算服务TICS
中小微企业为申请银行贷款跑断腿?税务、人社、住建、水、电……为了给企业有更好的信用建模,需要向不同的机构申请不同维度的数据,流程冗长复杂,让人望而生畏。
探索和发现新的药物,需要结合多家医疗和科研机构的基因、临床、药物数据,可是这些样本数据散落在不同医疗和科研机构手中,有的数据不能共享,有的不愿意共享。
货物运输,由于苏伊士运河堵塞,需要快速为公司梳理出受到影响的货物和客户,以及快速给出备份方案,可是合同、研发、供应链、部件等数据位于企业内外不同的系统中,想要短时间盘点出来简直困难重重。
……
数据要素的重要性已毋庸置疑,但是如果无法流通起来,就像上面例子所示,就会大大制约经济社会的数字化发展进程,难以充分开发出数据价值。
政企数据可信流通存难题
当前,在政府和企业的信息化系统中,普遍存在着应用“烟囱”和数据孤岛现象。在政府,委办局之间、甚至委办局内部不同科室都可能存在数据割裂现象;在企业,不同职能部门、分支机构、投资公司,都可能有着自己的应用系统、数据库和大数据平台。
究其原因,政企或是出于对数据保护的考虑,亦或是组织管理机制的问题,信息系统设计的限制,导致不同部门之间的数据共享和流通存在巨大障碍。各类机构对于数据流通顾虑重重,就容易造成数据的重复采集、冗余开发和信息不完整,带来决策分析不准确、甚至决策失误等问题。
数据即资产,既希望实现数据的高安全可信,也希望通过数据流通创造要素价值,二者要兼得。那么,能否构建可信的数据流通价值链,让各方可以把自己的数据在自己的信任域中进行可信计算,再将结果加密汇聚起来进行整合计算,实现“数据可用不可见,可控可计量”?
华为云TICS让“鱼”与“熊掌”兼得
在这样的大背景下,华为云在今年推出FusionInsight可信智能计算服务TICS,目标实现数据的可信流通和计算。比如将原始明细数据控制在所属方的信任域,同时又通过互信联盟实现了多方数据的联邦计算,从而将散落在不同机构的数据联合起来,转换成有价值的信息或模型,实现数据流通。
华为云FusionInsight可信智能计算服务TICS框架
该服务基于华为可信流程打造,通过了信通院和人民银行金标委等权威机构在联邦学习、安全多方计算、可信执行环境等方向的认证,作为中立第三方,旨在为政府、金融、消费、医疗、工业等领域提供可信智能计算平台。
华为云FusionInsight可信智能计算服务TICS并不是一项单一的技术,而是一套理论框架和技术体系,是大数据、密码学、人工智能、区块链、可信硬件、安全容器等领域的交叉和融合。
在多方数据库联合查询场景中,平台既要做到保护敏感明细数据,又要实现多方数据库的联邦统计分析。在多方样本或特征的联合建模场景中,平台既要对敏感ID和特征进行保护,又要把多方样本或特征联合起来训练出更好的模型。这个过程中华为云FusionInsight可信智能计算服务TICS会为各参与方提供全生命周期的监控和管理,TICS和华为云区块链服务紧密配合,进行数据管理和计算过程的确权和存证,做到整个计算过程可追踪可审计。
华为云FusionInsight可信智能计算服务TICS极具开放性。囊括行业主流算法,支持3大任务场景、7大类可信技术、60+原子化算子,根据最佳实践,会为计算任务匹配选择最优协议组合;具有丰富的集成对接能力,开放了80+北向接口,支持与伙伴一起打造联合解决方案;支持丰富的部署形态,包括华为公有云、混合云、智能边缘、华为云金融专区等,满足不同行业和组织的合规需求。
华为云FusionInsight可信智能计算服务TICS还提供多种专利技术,保障数据安全,提升计算效率。例如,将联邦SQL与多方安全计算技术深度融合,实现SQL执行前、执行中、执行结果的全流程安全保护;再如,TICS具备多层级自适应的ID求交能力,能够满足数十亿量级ID的求交,从7小时提升到30 分钟。
2021年,《数据安全法》和《个人信息保护法》相继生效,为数据的开发利用和安全保护提供了规范和指引。为充分发挥数据价值,实现可持续发展,政企等组织在保护数据安全和个人信息的前提下实现数据要素流通就显得至关重要。尤其是关系到国计民生的重要领域,迫切需要破解数据孤岛难题,实现数据可信流通。华为云FusionInsight可信智能计算服务TICS的推出,让“鱼”和“熊掌”兼得成为可能。
好文章,需要你的鼓励
这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。
卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。
过去七年中,基于机器学习的AI工具几乎完全自动化了地震学的基础任务——地震检测。AI模型能够检测到比人工分析师更小的地震,特别是在城市等嘈杂环境中。斯坦福团队开发的地震变换器等模型使用一维卷积和注意力机制,在包含120万个人工标记样本的数据集上训练。这些工具通常能发现比传统方法多10倍以上的地震,为火山结构成像和地质研究提供了更全面的地震目录。
腾讯混元团队联合北京大学提出MixGRPO技术,通过混合ODE-SDE采样策略和滑动窗口机制,将AI图像生成训练效率提升50%-71%,同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略,专注于图像生成早期阶段的重点优化,并引入高阶求解器进一步加速训练过程,为AI图像生成的产业化应用提供了更高效可行的解决方案。