当今企业正在利用不断增长的数据获得竞争优势,也就是采用数据科学、人工智能、机器学习、甚至是深度学习领域的新兴技术来准备和组织大数据,开发机器学习算法和预测模型,为分析师和IT员工所使用的业务智能应用提供支持。
以下就让我们来看看这10家在数据科学和机器学习领域拥有领先产品的初创公司。
Apheris

高管:Robin Rohm,联合创始人、首席执行官
总部:德国柏林
Apheris成立于2019年,主要提供支持跨公司数据科学运营和协作的平台。该平台软件可以安全地分析来自多方的分布式数据,同时保持专有信息的私密性。
去年8月Apheris在种子轮融资中获得了250万欧元(约合298万美元)。
Arrikto

高管:Constantinos Venetsanopoulos,创始人、首席执行官
总部:美国加州圣马特奥
Arrikto成立于2014年,它的旗舰产品Arrikto Enterprise Kubeflow是一个完整的机器学习操作(MLOps)平台,可以将数据科学家和DevOps结合在一起,在整个生产过程中简化和加速模型开发,并且确保安全性。Arrikto的目标是将DevOps中的原则引入机器学习数据中。
除此之外,Arrikto还提供了云原生的Rok Data Management Platform平台来管理机器学习开发和运营所需的数据,不管这些数据位于何处。
Comet.ml

高管:Gideon Mendels,联合创始人、首席执行官
总部:美国纽约
Comet开发了一个自托管、基于云的MLOps平台,用于机器学习模型的开发和监控。该系统可以帮助数据科学家追踪、对比、解释和优化机器学习实验和生产模型并管理相关数据集。
Comet公司成立于2017年,在今年4月的A轮融资中获得了1300万美元。
Databand.ai

高管:Josh Benamram,联合创始人、首席执行官
总部:以色列特拉维夫
Databand的统一数据可观察性和机器学习开发平台可以帮助数据工程师和数据科学家对于云原生系统(如Snowflake、Apache Spark和Apache Airflow)上运行的数据管道存在的数据质量问题进行识别、故障排除和修复。
Databand.ai公司成立于2018年,在2020年12月由Accel领投的A轮融资中获得了1450万美元。
dotData

高管:Ryohei Fujimaki,创始人、首席执行官
总部:美国加州圣马特奥
dotData开发的AutoML 2.0解决方案可用于数据科学工作流的自动化。dotData Enterprise机器学习和数据科学自动化平台可以处理数据摄取和整理、自动化功能设计、AutoML和模型操作化任务,而且所有这些都是零编码的。
dotData成立于2018年,今年2月推出了dotData Cloud,这是一个AI/ML自动化平台和服务,可为商业智能团队(尤其是那些没有数据科学团队的小型企业组织)提供快速实现AI/ML开发任务的自动化。今年5月dotData推出了dotData Py Lite容器化人工智能自动化系统,面向那些使用Python的数据科学家。
Explorium

高管:Maor Shlomo,联合创始人、首席执行官
总部:美国加州圣马特奥
Explorium开发了一个自动化外部数据平台用于高级分析和机器学习任务,该系统让数据科学家和业务分析师可以使用广泛外部资源。
Explorium的技术组合还包括用于自动发现数据和功能生成的Auto ML引擎,以及用于查找和集成最相关外部数据信号的Signal Studio。
Explorium公司成立于2017年,在今年5月的C轮融资中获得7500万美元,总融资金额达到1.27亿美元。
Iterative.ai

高管:Dmitry Petrov,联合创始人、首席执行官
总部:美国旧金山
Iterative开发的开源工具可用于扩展传统开发技术用于机器学习项目——尤其是涉及到非结构化数据的机器学习项目。
Iterative的产品组合包括DVC版本控制系统、用于持续集成/持续交付和部署的持续机器学习(CML)、以及刚刚发布用于项目协作的Studio。据该公司称,3月推出的新版本DVC和CML消除了对AWS SageMaker和Microsoft Azure ML Engineer等专有AI平台的需求。
Iterative.ai公司成立于2018年,刚刚在A轮融资中获得了2000万美元。
Noogata

高管:Assaf Egozi,联合创始人、首席执行官
总部:以色列特拉维夫
Noogata在今年3月推出了模块化的无代码AI数据分析平台,用于帮助企业和组织扩展他们的企业数据分析计划。该平台可以对数据洞察、预测、建议进行收集、丰富化和建模,并提供关于整个公司上下的可操作的自助分析。
Noogata公司成立于2019年,刚刚在种子轮融资中获得了1200万美元,早期客户包括Colgate-Palmolive以及百事可乐。
Spell.ml

高管:Serkan Piantino,联合创始人、首席执行官
总部:美国纽约
Spell.ml开发了一个用于深度学习操作(DLOps)的机器学习平台,并声称该平台超越了传统机器学习,具有准备、训练、部署、管理机器学习和深度学习模型整个生命周期的能力。
深度学习是机器学习技术的一个分支,它结合了依赖于AI神经网络的复杂学习模型,通常用于例如图像识别和自然语言处理这样的复杂任务。深度学习模型是计算密集型的,通常需要在配置了GPU和下一代AI处理器的高性能系统。
Spell.ml公司成立于2017年,他们与云无关的平台可以帮助降低深度学习模型开发的成本。Spell.ml的客户包括Square、Healx和Conde Nast等,此外还与具有深度学习实践的系统集成商、构建深度学习驱动软件的应用开发人员展开合作。
Tecton.ai

高管:Mike Del Balso,联合创始人、首席执行官
总部:美国旧金山
Tecton.ai于2020年4月走出隐身模式,其机器学习数据平台旨在让数据科学家能够将原始数据转化为支持机器学习模型的预测信号。Tecton.ai的目标是解决作为企业部署机器学习最大障碍之一——数据挑战。
Tecton.ai公司创始人Mike Del Balso(首席执行官)、Kevin Stumpf(首席技术官)和Jeremy Hermann(工程副总裁)曾就职于Uber,当时Uber正在开发和部署新的机器学习模型,他们开发了Uber的Michelangelo机器学习平台,然后创立了Tecton.ai公司,致力于开发技术帮助其他公司应对运营机器学习的数据挑战。
Tecton.ai公司成立于2019年,已在多轮融资中共筹资6000万美元。
好文章,需要你的鼓励
阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统,通过绕过传统电网升级时间线,使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运,将作为响应电网的动态资产,在需求高峰期放电,增强区域电网可靠性。这标志着美国首次使用专用电池系统加速大型数据中心并网。
威斯康星大学研究团队开发了LUMINA系统,专门检测AI在回答问题时的"撒谎"行为。该系统发现AI有时会忽视提供的参考资料,固执地依赖内部知识生成不准确回答。LUMINA通过监测AI对外部文档和内部知识的依赖程度来识别这种行为,在多个测试中达到90%以上的准确率,比以往方法提升13%,为构建更可信的AI系统提供了重要工具。
微软在Edge浏览器中推出增强版Copilot模式,提供更强大的AI代理功能,目前在美国进行限量预览。该模式包含Actions和Journeys两大功能:Actions让浏览器能代表用户执行任务,如语音控制打开网页或查找文章特定内容;Journeys则记住用户浏览历史,帮助用户继续之前的研究任务。此举正值AI浏览器竞争加剧,OpenAI推出ChatGPT Atlas、Perplexity发布Comet、谷歌集成Gemini到Chrome。目前Chrome占据71%市场份额,Edge仅占4.67%。
这项由法国CentraleSupélec大学领导的研究通过严格控制的实验,系统比较了AI的推理训练与传统训练方式。研究发现推理训练在数学、开放式任务中效果显著,但需要70亿参数以上模型才能充分发挥优势,且成本增加明显。研究为AI开发者提供了明确的应用指导,有助于根据具体场景选择最优训练策略。