开源与闭源的融合构建大数据分析生态

作者：王聪彬

目前B2B数据分析整个市场总量还很小，而且对数据分析的要求更高。因为单一平台不能解决大数据的所有问题，这也有了开源与闭源技术的混合需求，构建大数据分析的生态系统，在IoT数据大量爆发的时代为各行各业提供对应的分析能力。

ZD至顶网CIO与应用频道 05月27日人物访谈（文/王聪彬）：大数据分析在日积月累的过程中正在不断发生着改变，之前数据分析更多聚焦在B2C领域，现在随着物联网的发展则转向B2B领域，形成B2B+B2C的模式。麦肯锡报告显示，数据分析70%的价值来自于B2B，30%的价值来自于B2C，所以大家都在向2B市场分析来做转型。

但目前B2B数据分析整个市场总量还很小，而且对数据分析的要求更高。因为单一平台不能解决大数据的所有问题，这也有了开源与闭源技术的混合需求，构建大数据分析的生态系统，在IoT数据大量爆发的时代为各行各业提供对应的分析能力。

IoT数据分析需要7大支撑

IoT的快速发展让数据分析也要更进一步，因为IoT的数据量是传统数据的100倍，这就需要强大可扩展的数据平台来存储和处理这些数据；IoT的地理空间数据比例非常大，需要拥有先进的地理空间分析能力；IoT中有大量基于时间序列的时间数据需要分析，传统SQL并不善于处理。

数据量、地理空间数据、时间序列数据三方面都是IoT数据相比于传统数据的不同之处。Teradata天睿公司首席技术官宝立明（Stephen Brobst）提到，随着IoT数据的可分析也标志着我们已经真的进入了“万物皆可分析”的时代，通过传感器采集到的数据终于可以发挥其价值。

Teradata天睿公司首席技术官宝立明（Stephen Brobst）

其实在2015年Teradata Partners大会上，Teradata就提出了“万物皆可分析”（Analytics of Everything）的概念。但基于传感器的数据应用更多集中在制造业层面，所以Teradata的一个业务重点便是要向制造业转移。当然万物皆可分析也包含了来自各行各业的数据，如电信行业收集手机的地理位置信息，医疗行业医疗设备收集的身体指标数据等等。

在Teradata提供的产品中对于IoT数据的分析可以分为七类，第一、Teradata Listener框架，以实时的方式把海量的数据导入到Teradata系统；第二、利用RESTful API实现各种技术平台的对接；第三、可靠、高可伸缩的数据传输技术；第四、存储技术；第五、可兼容技术；第六、压缩技术；第七、即将推出TeradataIntelliFlex一体机产品，采用下一代海量并行处理（MPP）架构，能以非常高的经济性，有效地进行海量数据的处理。

除了刚刚说到的七部分，Teradata实现万物皆可分析的基础还是统一数据架构（UDA），其结合了Teradata的技术、开源技术、数据湖等技术。

“我们可以将数据先放到数据湖中存储，经过Aster进一步处理，导入到数据仓库为BI使用。”宝立明说道，UDA中的Aster是一个非常适合处理传感器数据的平台，而且已经被移植到Hadoop上，既可以在文件系统上去执行，也可以在开源的数据库上应用。

从跳高演变看技术整合

正如UDA的架构，开源和闭源已经实现融合，而这在之前是不可想象的。宝立明用跳高姿势的演变举例，在之前跳高的姿势都是剪刀腿，而到了80年代跳高遇到了一个转型期，背越式的出现比剪刀腿能取得更好的成绩。

这也使得越来越多的选手开始采用背越式，当然选手可以依然待在安全区，但你最终不会成为赢家。通过12年的发展背越式完全取代了剪刀腿，这就如同采用新技术也是一个痛苦的过程一样，企业需要实现商业技术和开源技术的整合。

在15年前，Teradata就已经把数据库产品跑在Unix、Linux开源的版本之上，一直到今天也是如此。

在UDA的组合中不仅有开源Hadoop，宝立明还特别提到同Facebook合作研发的开源分布式SQL查询引擎Presto，以及运行在Presto上面的QueryGrid，其可以在Hadoop平台发起并完成跨平台查询，所以UDA已经是一个商业技术和开源技术融合的开放架构。

同时Teradata也为机器学习提供一个具有高可延展性的大数据平台，把机器学习的算法，像R、Ruby内嵌到平台之上，供Teradata的数据科学家做各种各样的实验和探索，更好地找到一些成熟可商用的技术，整合到解决方案中。

在云计算战略上，为了和企业的应用趋势匹配，数据分析的重心也正在向云中转移，尤其是现在企业的业务系统逐渐前移到云端，分析也将转移到云端。

Teradata的原则是给客户提供同类最佳技术的选择，AWS是目前宣布的第一家公有云合作伙伴，未来在Microsoft Azure、谷歌云上都会提供服务，目标是在不同云平台上都可以提供同样的数据分析能力。

来源：至顶网CIO与应用频道

0赞

好文章，需要你的鼓励

开源与闭源的融合构建大数据分析生态

来源：至顶网CIO与应用频道

2016

05/27

08:00

分享

点赞

那些年的国民零食，为什么突然在拼多多火了？

AI再走一步，会发生什么？答案在“预见2026”

CCF HPC China 2025鄂尔多斯完美谢幕，共谱超算新篇章

生成式引擎优化GEO：在线零售商的新营销手册

数据中心电池储能系统如何抵御新兴网络威胁

英特尔如何解决数据中心液冷技术的“接头难题”？

Google发布Pixel 10系列及新AI智能助手功能

Google推出Gemini for Home智能家居新战略

Salesforce推出政府专用AI智能体，或将替代部分政府工作人员

CachyOS超越Mint和MX成为DistroWatch排行榜冠军

谷歌发布Pixel 10系列主打AI手机功能

Black Hat USA 2025：企业浏览器之年

从隐私计算迈向六大数据流通全栈技术，“隐语”开源社区升级

5G-A全场景物联，实现AI智赋万物

对话SUSE亚太区CTO Vishal Ghariwala：用开源拆掉企业AI的“无形围墙”

AI助燃数字创新 SUSE Summit 2025创新峰会隆重召开

AMD全栈战略浮出水面：开源很好，所以我们要造GPU、ROCm和AI机架全生态

Databricks 开源声明式 ETL 框架，实现流程构建加速90%

Automattic 表示将在暂停后恢复对 WordPress 的贡献

阿里云GraphScope Flex登顶权威榜单，每秒处理超8万次请求

一年后，Valkey 在从 Redis 分叉后规划 v9 路线

Linus Torvalds 频繁打错字后重拾机械键盘

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: