谷歌和AWS此前曾强调他们在机器学习模型方面展开工作,将有助于各国应对世界各地日益频繁发生的环境危机。
随着本周2021年英国联合国气候变化大会(COP26)落下帷幕,这两家公司也纷纷表示将积极应对洪水和野火等气候变化所带来的影响。
谷歌:基于机器学习的洪水预测系统
谷歌发表了一篇未经同行评议的论文,是关于谷歌基于机器学习模型的洪水预测系统,该系统号称“为机构和公众提供了精确的实时洪水预警,重点预测对象是经过测量的大型河流的洪水”,论文由谷歌研究中心和以色列耶路撒冷希伯来大学的研究人员撰写。
谷歌于2018年启动了洪水预测项目,主要是通过智能手机向受洪水影响地区的人们发送警报。该项目是谷歌危机响应计划的一个组成部分,谷歌致力于通过该计划与前线和紧急救援人员合作开发相关技术。
项目自2018年启动以来,已经扩展到印度和孟加拉国的大部分地区,覆盖约2.2亿人口。直到2021年季风季节,这一范围已经扩展到覆盖了3.6亿人居住的地区。
谷歌工程副总裁、危机响应项目负责人Yossi Matias在一篇博文中表示:“我们借助更好的洪水预测技术,已经累计发送了1.15多亿条警报,是此前发送数量的3倍。”
这种警报中不仅仅会告知河流将上涨多少厘米,而且由于采用了基于长短期记忆(LTSM)深度神经网络的新机器学习模型,现在还能够提供所谓的“淹没地图”,将洪水的范围和深度作为一个图层显示在谷歌地图上。
研究人员认为,“LSTM模型的性能优于概念模型,后者主要是对每个盆地的长期数据记录进行校准。”
谷歌研究人员表示:“虽然之前的研究提供了令人欣喜的结果,但很少能找到以机器学习模型为核心元素、能够及时准确地计算洪水预警的实操系统。”
AWS:利用机器学习等技术预防丛林火灾
与此同时,AWS一直在与澳大利亚墨尔本能源公司AusNet展开合作,以帮助缓解该地区的丛林大火。
AusNet拥有5.4万公里的电力线,为维多利亚州约150万户家庭和企业提供能源。据估计,该电网有62%是位于丛林火灾高风险地区。
AusNet此前一直使用配备了谷歌地图式的LiDAR摄像头和Amazon SageMaker机器学习的汽车,来绘制该州需要修剪植被的区域,从而帮助阻止丛林火灾威胁,以前该系统依赖于GIS(地理信息系统)并使用自定义工具来标记LiDAR点。
AusNet与AWS展开合作,利用AWS的深度学习模型、GPU实例和S3存储,实现了对LiDAR点的自动分类。
AWS在一篇博文中指出,AusNet和AWS构建了一个语义分割模型,可以准确地对导体、建筑物、电线杆、植被和其他类别的3D点云数据进行分类。
“现在团队能够以每个Epoch 10.8分钟的速度对1571个文件中的17.2 GiB未压缩数据进行模型训练,总计约6.16亿个点。推理方面,团队能够早22.1个小时内对总计15个文件中的33.6 GiB未压缩数据进行处理,这意味着平均每秒推理大约15760个点,其中包括了摊销之后的启动时间,”AWS表示。
AusNet产品经理Daniel Pendlebury表示:“能够快速准确地标记我们的航测数据,这是最大程度上降低丛林大火风险的一个关键部分。”
“通过与Amazon机器学习解决方案实验室展开合作,我们能够打造出在数据标记方面实平均准确率高达80.53%的模型,预计通过采用这套新的解决方案,我们手动进行标记的工作量会减少高达80%。”
好文章,需要你的鼓励
Roig Arena 将于 2025 年 9 月在瓦伦西亚开业,借助 Extreme Networks 的 6GHz Wi-Fi 与数据分析技术,实现无缝运营与个性化观众体验,打造全天候活动中心。
EasyText是一项由新加坡国立大学、香港中文大学与Tiamat AI、Liblib AI合作开发的多语言文本渲染框架。基于扩散变换器(DiT)技术,它能将多语言字符编码为字符标记,并通过创新的字符位置编码技术实现精确文本布局控制。研究团队构建了包含100万多语言图像-文本对的大型合成数据集和2万高质量标注图像的精选数据集,用于预训练和微调。实验证明,EasyText在多语言文本渲染、视觉质量和布局感知文本集成方面表现卓越,支持超过十种语言,能处理弯曲和倾斜区域,实现前所未有的文本渲染精度和自然度。
OpenMamba 是一款意大利独立滚动更新的 Linux 发行版,基于 Fedora 工具构建,提供 KDE Plasma 与 LXQt 桌面。它采用最新组件和标准打包工具,运行稳定且易用,适合规避主流系统限制的用户。
波森AI研究团队开发的EmergentTTS-Eval是一个针对文本转语音(TTS)系统的全面评估框架,专注于测试六大挑战场景:情感表达、非语言线索、外语词汇、语法复杂性、复杂发音和问题表达。研究创新地采用大型音频语言模型作为评判者,从一小组种子提示迭代生成了1,645个测试用例。评估结果显示OpenAI的GPT-4o-Audio表现最佳,同时研究证实了模型评判结果与人类偏好高度一致。该工作已开源,为TTS技术评估提供了可扩展、客观且全面的新标准。