至顶网CIO与CTO频道 04月02日 编译:有关COVID-19大流行的数据迅速被整合及剪辑,一众高科技厂商为业余流行病学及数据科学工作者打造了一些分析工具栈。
结果:新冠状病毒爆发的可视化极可能是史无前例的。
COVID-19爆发后不久就出现了第一个数据分析仪表板及整合工具。该仪表板(网址)由约翰·霍普金斯大学推出,目前已成为最常用的数据来源,仪表板整合了来自世界卫生组织、美国疾病预防控制中心、WHO、NHC、DXY、1point3acres、Worldometers.info、BNO、以及美国各州和国家政府卫生部门以及各地媒体报道的资料并对其进行了可视化处理。
霍普金斯大学还将数据放在GitHub上(https://github.com/CSSEGISandData/COVID-19 )供有兴趣的人下载。该仪表板于1月23日推出,到目前为止关于COVID-19的数据集可以说是成了最具可视化性的数据集。COVID-19数据集来自各种不同的源,如何为分析提供干净的数据就成了各家努力的目标。
以下列出各家在这方面所做的一部分工作
·Tableau用上霍普金斯大学的数据并发布了一个启动仪表板。 Tableau的主要贡献是将数据做处理后提供各种格式以及可视化模板。
·开源数据集也派上了用场。研究人士和大西洋(The Atlantic)网站的写手利用开源软件将各种数据源汇集在一起。
·GitHub上的数据集含新冠状病毒的一系列数据集,data.world和Kaggle也拥有一些数据集,Kaggle上有比赛、预测和可视化等等。
·Reddit的 Data is Beautiful 分版是可视化业余爱好者和数据科学家聚集的地方。 我们的世界数据网站拥有强大的COVID-19研究和数据一览。
·Esri将自己的映射和地理定位专业知识用于COVID-19跟踪。
·雪花(Snowflake)是个云数据平台,上面介绍过数据服务公司Starschema 推出的一个免费数据集,目标是成为COVID-19发病率和死亡率真相单一源。该数据集加入了相关的人口密度及地理定位信息。
·IBM将 COVID-19数据整合到天气频道应用程序里,将气象数据和当地新型冠状病毒事件融合在一起。IBM子公司通过该天气频道程序可以将相关的COVID-19数据发送给每月3亿个活跃用户。IBM可视化方面的工作和谷歌及微软在这方面的努力类似,目的是将COVID-19数据推送给大众。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。