至顶网CIO与CTO频道 04月02日 编译:有关COVID-19大流行的数据迅速被整合及剪辑,一众高科技厂商为业余流行病学及数据科学工作者打造了一些分析工具栈。
结果:新冠状病毒爆发的可视化极可能是史无前例的。
COVID-19爆发后不久就出现了第一个数据分析仪表板及整合工具。该仪表板(网址)由约翰·霍普金斯大学推出,目前已成为最常用的数据来源,仪表板整合了来自世界卫生组织、美国疾病预防控制中心、WHO、NHC、DXY、1point3acres、Worldometers.info、BNO、以及美国各州和国家政府卫生部门以及各地媒体报道的资料并对其进行了可视化处理。
霍普金斯大学还将数据放在GitHub上(https://github.com/CSSEGISandData/COVID-19 )供有兴趣的人下载。该仪表板于1月23日推出,到目前为止关于COVID-19的数据集可以说是成了最具可视化性的数据集。COVID-19数据集来自各种不同的源,如何为分析提供干净的数据就成了各家努力的目标。
以下列出各家在这方面所做的一部分工作
·Tableau用上霍普金斯大学的数据并发布了一个启动仪表板。 Tableau的主要贡献是将数据做处理后提供各种格式以及可视化模板。
·开源数据集也派上了用场。研究人士和大西洋(The Atlantic)网站的写手利用开源软件将各种数据源汇集在一起。
·GitHub上的数据集含新冠状病毒的一系列数据集,data.world和Kaggle也拥有一些数据集,Kaggle上有比赛、预测和可视化等等。
·Reddit的 Data is Beautiful 分版是可视化业余爱好者和数据科学家聚集的地方。 我们的世界数据网站拥有强大的COVID-19研究和数据一览。
·Esri将自己的映射和地理定位专业知识用于COVID-19跟踪。
·雪花(Snowflake)是个云数据平台,上面介绍过数据服务公司Starschema 推出的一个免费数据集,目标是成为COVID-19发病率和死亡率真相单一源。该数据集加入了相关的人口密度及地理定位信息。
·IBM将 COVID-19数据整合到天气频道应用程序里,将气象数据和当地新型冠状病毒事件融合在一起。IBM子公司通过该天气频道程序可以将相关的COVID-19数据发送给每月3亿个活跃用户。IBM可视化方面的工作和谷歌及微软在这方面的努力类似,目的是将COVID-19数据推送给大众。
好文章,需要你的鼓励
新加坡国立大学团队开发了PaperDebugger,这是首个直接嵌入Overleaf编辑器的AI学术写作助手。系统采用多智能体架构,用户选中文字后即可获得润色建议、文献调研和结构化评审,修改以差异对比形式展现并可一键应用。已通过Chrome应用店发布,获112人安装、4.9分好评,验证了编辑器内AI辅助的实用价值。
中科院与字节跳动联合发布DAComp基准测试,发现即便是最先进的AI模型在企业级数据工程和分析任务中表现远不如预期。测试显示最强模型的成功率仅20%,揭示了AI在系统协调、商业洞察等方面的重大局限性,为企业数字化转型提供了重要参考。