至顶网CIO与CTO频道 04月02日 编译:有关COVID-19大流行的数据迅速被整合及剪辑,一众高科技厂商为业余流行病学及数据科学工作者打造了一些分析工具栈。
结果:新冠状病毒爆发的可视化极可能是史无前例的。
COVID-19爆发后不久就出现了第一个数据分析仪表板及整合工具。该仪表板(网址)由约翰·霍普金斯大学推出,目前已成为最常用的数据来源,仪表板整合了来自世界卫生组织、美国疾病预防控制中心、WHO、NHC、DXY、1point3acres、Worldometers.info、BNO、以及美国各州和国家政府卫生部门以及各地媒体报道的资料并对其进行了可视化处理。
霍普金斯大学还将数据放在GitHub上(https://github.com/CSSEGISandData/COVID-19 )供有兴趣的人下载。该仪表板于1月23日推出,到目前为止关于COVID-19的数据集可以说是成了最具可视化性的数据集。COVID-19数据集来自各种不同的源,如何为分析提供干净的数据就成了各家努力的目标。
以下列出各家在这方面所做的一部分工作
·Tableau用上霍普金斯大学的数据并发布了一个启动仪表板。 Tableau的主要贡献是将数据做处理后提供各种格式以及可视化模板。
·开源数据集也派上了用场。研究人士和大西洋(The Atlantic)网站的写手利用开源软件将各种数据源汇集在一起。
·GitHub上的数据集含新冠状病毒的一系列数据集,data.world和Kaggle也拥有一些数据集,Kaggle上有比赛、预测和可视化等等。
·Reddit的 Data is Beautiful 分版是可视化业余爱好者和数据科学家聚集的地方。 我们的世界数据网站拥有强大的COVID-19研究和数据一览。
·Esri将自己的映射和地理定位专业知识用于COVID-19跟踪。
·雪花(Snowflake)是个云数据平台,上面介绍过数据服务公司Starschema 推出的一个免费数据集,目标是成为COVID-19发病率和死亡率真相单一源。该数据集加入了相关的人口密度及地理定位信息。
·IBM将 COVID-19数据整合到天气频道应用程序里,将气象数据和当地新型冠状病毒事件融合在一起。IBM子公司通过该天气频道程序可以将相关的COVID-19数据发送给每月3亿个活跃用户。IBM可视化方面的工作和谷歌及微软在这方面的努力类似,目的是将COVID-19数据推送给大众。
好文章,需要你的鼓励
Docker公司发布重大新功能,旨在简化智能体AI应用的构建、运行和部署。公司扩展了Docker Compose工具以支持AI智能体和模型的大规模部署,并推出Docker Offload服务,允许开发者将AI工作负载转移到云端。新功能还支持模型上下文协议网关的安全连接,并与谷歌云、微软Azure等合作伙伴集成。
这项研究首次将在线强化学习成功应用于流匹配模型,通过巧妙的ODE到SDE转换和去噪减少策略,显著提升了AI图像生成的精确度和可控性。在复合场景生成、文字渲染等任务上取得突破性进展,为AI生成领域开辟了新的技术路径。
欧盟发布AI法案实施细则,要求谷歌、Meta、OpenAI等公司承诺不使用盗版材料训练AI,详细披露训练数据来源和模型设计理念。新规还要求公司尊重付费墙和网站爬虫限制,公开训练和推理的总能耗,并在5-10天内向欧盟AI办公室报告安全事件。违规企业可能面临年销售额7%或3%的罚款。
这篇由阿里巴巴集团联合多所知名高校发表的综述论文,系统梳理了统一多模态理解与生成模型的最新发展。研究将现有模型分为扩散、自回归和混合三大类型,详细分析了不同图像编码策略的特点,整理了相关数据集和评估基准,并深入探讨了当前面临的技术挑战。