ZD至顶网CIO与应用频道 04月15日 评论分析(文/王聪彬):开放源码协议是由曾是Debian的创始人之一的Bruce Perens提出,1980年第一个开放源码项目的出现到现在已经经历了36年。
原Debian的创始人Bruce Perens
在这期间开源经历了不少波折,一代又一代的开源技术孕育而生,同时一代又一代的开源技术也在被抛弃。开源经历了这么多年的发展,在企业中真正的使用情况究竟如何?
以IT技术为企业核心竞争力的企业,在开源上都已有了相应的实践,也取得一定成果,尤其以互联网企业为代表。在IT建设上比互联网企业慢一拍甚至更多的传统企业则分成两派,一派是拥有相对较强技术实力的大型企业在积极尝试开源技术,另一派中小型企业在开源技术上的应用遇到了相当多的困难,成效上也并不理想,更多选择商业版开源产品,大家都在积极的使用开源在做一些事。
对开源技术的态度
我们也先来看看开源技术的几个代表,企业中最常见的开源技术就是Linux。其最初是由芬兰赫尔辛基大学的一名学生Linus Torvalds编写,当时他只是有一个妄想写一个比Minix更好的Minix,却没想到时至今日达到这样的普及度,企业在Linux的使用上已经相当纯熟。
到了云计算时代,中国一些特殊行业需要基于安全、可控等因素部构建和部署云计算,当然这里指的是混合架构。OpenStack的出现也打破了企业在开源云计算部署的突破口。提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。
OpenStack更多基于IaaS层面,而在PaaS层面也出现了Docker,一个基于LXC 的高级容器引擎。诞生于2013年的Docker,2年间已经在企业中遍地开花,越来越多的企业将服务器应用程序从虚拟机(VM)转移到容器。在快速演化的过程中两种技术也有融合的趋势。
同时针对Docker的调度,又涌现出Mesos、Kuberrnetes等技术。Mesos源自加州伯克利大学AMP实验室,在Apple、Twitter、Airbnb等外国IT企业中已经开始得以应用,Twitter 最大的 Mesos 集群已经有上万台服务器之多。Kubernetes 源自 Google虽然诞生时间仅有一两年的时间,但是因为 Google 巨大的影响力,Kubernetes 也受到了广泛的关注和应用。
大数据技术在云计算之后被提出作为提升管理决策之用,大数据技术在经历了分析结构化、半结构化、非结构化已经可以实现一切皆可分析。但这还不够Hadoop这种分布式系统基础架构的出现可以提供HDFS分布式数据存储功能之外,还提供了叫做MapReduce的数据处理功能。在大型企业中Hadoop的应用也是随处可见,IT商业企业也开始做相关研发提供服务。当然还有之后出现的处理速度更快的Spark。
开源技术之应用
介绍了关键的开源技术的发展和使用现状,我们也来看看几个传统企业真实案例,看看他们在开源应用上到底经历了怎样的磨难以及获得哪些成效,当然这些企业并不止在一种开源技术上做了实践。
国家电网是将IT的管理、建设、维护分成三部分,从2010年开始提出云计算框架,最开始是基于业务场景完全自主开发,2014年开始使用社区版OpenStack自行研发,预计到明年国家电网也可能成为国内最大的OpenStack应用企业。国家电网相关负责人也和我说过其实在使用OpenStack之前都没有看到更好云计算框架。他也提到使用效果低于预期,主要是因为之前原有基础架构不合理,现在也在逐步改造,所以在做OpenStack规划时,也要把基础架构从新评估,才能达到最高的效果,国家电网在调研分析上就用了1年。
相对于国家电网的强集约化管理,各地区运营商是可以选择不同的产品和解决方案。其中浙江移动公司的数据中心在发展上面临分布式调度与协调的问题,其数据中心操作(DCOS)方案采用了以容器为基础封装各类应用和运行环境,以 Mesos、Marathon 为核心实现容器资源的分布式调度与协调,以 Haproxy、Confd、 Etcd 实现服务注册和业务的引流。在弹性、稳定性、可用性、敏捷开发部署、资源利用率、跨数据中心资源调度上都有了一定的提升。
Hadoop在金融行业的应用最为普遍,其可以用它来存储银行业的离线数据,并开发相应的算法对这些数据进行挖掘分析,提高银行企业对历史数据的利用价值。使用基本是保持原有系统架构不变,在核心系统层增加Hadoop平台系统,实现核心系统的历史数据存储备份、数据查询、数据挖掘处理。早在2013年光大银行就基于Hadoop构建起核心历史数据查询平台,可为客户提供联机历史数据查询应用功能,将3-4天的查询时常缩减到当日完成,大大提升运营效率。
开源闭源之争一直没有停止过,一些CIO也和我谈及,去IOE喊了这么多年,真正将核心改造的企业却没有几个,所以只能随着新技术出现来打破一些技术壁垒逐步实现转型,这也是为什么各大公司开始对开源研发和运维加大投入。
开源的路还在继续
对于开源技术CIO们都有自己的考量,除了上文提到了诸多优点,他们普遍认为开源在稳定性和维护性上还有所欠缺。
企业自己利用开源代码来构建一个框架或系统是一个浩大的工程,传统企业不同于互联网公司有着较为丰富的技术实力,但是其中也有一部分大型企业在自己针对开源做开发,例如金融、电信、能源等行业,但调研实施的过程中也会或多或少伴随开源服务提供商的合作和咨询。
而那些中小企业既没有技术做支撑也没有像金融、电信企业一样有几百人的IT团队,所以在开源上的出路基本都是使用商业版本的开源产品。
这样也可以规避刚刚提到开源的一些弊端,但CIO们心里也非常明白,即使使用商业开源自己也还是没有拿到核心控权。而且开源服务价格并不低,这也是很多企业没有使用的原因之一,但一些开源IT提供商可能并不这么认为。
毋庸置疑,开源是一个难啃的骨头,但是还是有越来越多的企业投身于此,尤其是创业型企业,他们迅速的获得了ABCD轮,但其实真正的开源市场走向并不是几家IT厂商可以把控。就如同前一阵OpenStack的唱衰论,刺激了不少国内创业型开源服务商,虽然Gartner分析师进行了辟谣,但是到2020年全球OpenStack整体市场规模达到30亿美元,盘子也并不算大。
在开源的市场中企业尤其是传统企业在才是这中间真正的推动者,俗话说实践出真知,技术产品服务提供商也不能固守在某项技术中,多听听CIO们心中真正的烦恼,开源市场才能更美好。
“CIO在思考”是“26维自媒体联盟”的创始成员,“26维自媒体联盟”致力成为北半球最靠谱的企业级科技自媒体联盟。
长按二维码,选择“识别图中二维码”即刻关注
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。