此前,欧盟(EU)和联合国(UN)启动了海洋数字孪生(Digital Twin of the Ocean,DTO)项目,旨在开发创新的海洋学解决方案。
海洋未来模拟
这么做的目的是通过结合与海洋相关的所有可用资源,对海洋或者部分海洋进行高分辨率的模拟。通过使用高性能计算、数据分析和人工智能(AI)技术,可以整合各种数据和模型,并将其转化为可使用的信息,为决策提供支持。
DTO计划旨在提供对海洋当前状态准确且全面的描述,并帮助预测海洋未来的演变,因此,这既是一个连续的、实时的监测(从海岸到远海,从表面到深海),也是一个模拟环境,用于创建可能的未来模型,创建“假设”情景,以分析例如气候变化和人类活动对海洋生态系统的影响,或者减少气候风险措施可能带来的影响。
通过把不同来源的数据和模型汇集在一个单一的、可访问的、交互式的框架中,这一举措可促进科学合作、涉及自然科学、经济学和人文社会科学的跨学科方法,有助于共同打造解决方案。
使用海洋信息的数字框架
2020年9月,欧盟委员会发布了“Transparent and Accessible Seas and Oceans: Towards a Digital Twin of the Ocean”倡议。这个欧洲版的DTO计划旨在帮助欧盟委员会实现在绿色协议和数字化方面做出的承诺,开发非常高精度的地球数字模型(Destination Earth Initiative项目)。根据欧盟委员会估计,第一个版本将在2024年之前投入使用。
与此同时,联合国也宣布2021年是“海洋十年”(Decade of the Ocean)的开始。该计划的十大挑战之一,就是创建海洋的综合数字化虚拟体,目的是帮助国际社会实施可持续发展目标的第14条:“保护和可持续利用海洋、海洋资源”。
在这个背景之下,由德国基尔市海洋学研究中心GEOMAR管理的DITTO计划(“海洋数字孪生”)提出了建立和推进单一的、开放的、共享的数字框架,其中,建模、模拟、人工智能算法和其他技术将帮助海洋专业人士能够以可视化的方式,处理和分析所有类型的海洋数据。
该框架包含了一个基础的数字孪生,让用户(包括科学家、政府、联合国系统、民间社会)创建自己的本地或专有的孪生、测试场景以解决特定问题(例如商船数量的增加,对一定时期内某一海域的酸化程度和对珊瑚礁的影响)变成一种可能。
该计划的第一步,就是针对研究人员和实操海洋学感兴趣的几个场景,开发出多个数字孪生的原型。
DITTO计划下的里海(Caspian Sea)数字孪生项目已经启动了,将一直持续到2027年。Caspian Sea Data Centre将集中最新的数据归档、水动力模型、大气再分析、电子地图集、科学出版物等信息。
海洋数字孪生的构成
DTO是基于多个技术块和共享数据管理原则构建的。
首先,海洋和空间观测系统提供了现场数据、卫星数据以及海洋模型。观测网络为数字孪生提供信息并对其进行更新,反过来数字孪生又可以为它们提供信息并对其进行优化,从而形成一个“良性循环”。
其次,数据基础设施确保开放且公平的访问、海洋观测站之间的互连、以及所有可用数据的整合,这些数据来自船舶或海上自主系统的原位测量、卫星观测、来自多个学科的历史数据、以及来自工业或公民科学的数据等等。这个基础设施依赖于高性能计算能力,部分是在云中,还有一个定义数据交换标准和协议的治理框架。
DTO还集成了基于人工智能和机器学习的预测分析和建模工具,以处理数据和测试不同的场景。DTO还有一个界面,让用户可以根据需求查看、交互和自定义数据和模型。
因此,未来欧洲的DTO必须与当前欧盟的海洋观测能力(欧洲舰队、科研船只、EuroArgo自主系统等)以及成员国的海洋数据、建模和预测基础设施相互兼容,而后者主要是基于European Marine Observation and Data Network(EMODNet)和Copernicus Marine Service(CMEMS)的。
此外,DTO还应该允许实施数据的标准化,尊重欧盟认可的原则,例如FAIR原则(可查找、可访问、可互操作和可重复使用)。
海洋数字孪生正在帮助我们加深对海洋的了解,提高持续监测海洋的能力,让我们能够预测海洋的演变,并以可持续的方式管理海洋资源。这是一个独特的未来治理工具,适用于地球这一广阔地区,在气候、经济、生物多样性和粮食方面都是至关重要的。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。