ZD至顶网CIO与应用频道 04月15日 评论分析(文/王聪彬):开放源码协议是由曾是Debian的创始人之一的Bruce Perens提出,1980年第一个开放源码项目的出现到现在已经经历了36年。
原Debian的创始人Bruce Perens
在这期间开源经历了不少波折,一代又一代的开源技术孕育而生,同时一代又一代的开源技术也在被抛弃。开源经历了这么多年的发展,在企业中真正的使用情况究竟如何?
以IT技术为企业核心竞争力的企业,在开源上都已有了相应的实践,也取得一定成果,尤其以互联网企业为代表。在IT建设上比互联网企业慢一拍甚至更多的传统企业则分成两派,一派是拥有相对较强技术实力的大型企业在积极尝试开源技术,另一派中小型企业在开源技术上的应用遇到了相当多的困难,成效上也并不理想,更多选择商业版开源产品,大家都在积极的使用开源在做一些事。
对开源技术的态度
我们也先来看看开源技术的几个代表,企业中最常见的开源技术就是Linux。其最初是由芬兰赫尔辛基大学的一名学生Linus Torvalds编写,当时他只是有一个妄想写一个比Minix更好的Minix,却没想到时至今日达到这样的普及度,企业在Linux的使用上已经相当纯熟。
到了云计算时代,中国一些特殊行业需要基于安全、可控等因素部构建和部署云计算,当然这里指的是混合架构。OpenStack的出现也打破了企业在开源云计算部署的突破口。提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。
OpenStack更多基于IaaS层面,而在PaaS层面也出现了Docker,一个基于LXC 的高级容器引擎。诞生于2013年的Docker,2年间已经在企业中遍地开花,越来越多的企业将服务器应用程序从虚拟机(VM)转移到容器。在快速演化的过程中两种技术也有融合的趋势。
同时针对Docker的调度,又涌现出Mesos、Kuberrnetes等技术。Mesos源自加州伯克利大学AMP实验室,在Apple、Twitter、Airbnb等外国IT企业中已经开始得以应用,Twitter 最大的 Mesos 集群已经有上万台服务器之多。Kubernetes 源自 Google虽然诞生时间仅有一两年的时间,但是因为 Google 巨大的影响力,Kubernetes 也受到了广泛的关注和应用。
大数据技术在云计算之后被提出作为提升管理决策之用,大数据技术在经历了分析结构化、半结构化、非结构化已经可以实现一切皆可分析。但这还不够Hadoop这种分布式系统基础架构的出现可以提供HDFS分布式数据存储功能之外,还提供了叫做MapReduce的数据处理功能。在大型企业中Hadoop的应用也是随处可见,IT商业企业也开始做相关研发提供服务。当然还有之后出现的处理速度更快的Spark。
开源技术之应用
介绍了关键的开源技术的发展和使用现状,我们也来看看几个传统企业真实案例,看看他们在开源应用上到底经历了怎样的磨难以及获得哪些成效,当然这些企业并不止在一种开源技术上做了实践。
国家电网是将IT的管理、建设、维护分成三部分,从2010年开始提出云计算框架,最开始是基于业务场景完全自主开发,2014年开始使用社区版OpenStack自行研发,预计到明年国家电网也可能成为国内最大的OpenStack应用企业。国家电网相关负责人也和我说过其实在使用OpenStack之前都没有看到更好云计算框架。他也提到使用效果低于预期,主要是因为之前原有基础架构不合理,现在也在逐步改造,所以在做OpenStack规划时,也要把基础架构从新评估,才能达到最高的效果,国家电网在调研分析上就用了1年。
相对于国家电网的强集约化管理,各地区运营商是可以选择不同的产品和解决方案。其中浙江移动公司的数据中心在发展上面临分布式调度与协调的问题,其数据中心操作(DCOS)方案采用了以容器为基础封装各类应用和运行环境,以 Mesos、Marathon 为核心实现容器资源的分布式调度与协调,以 Haproxy、Confd、 Etcd 实现服务注册和业务的引流。在弹性、稳定性、可用性、敏捷开发部署、资源利用率、跨数据中心资源调度上都有了一定的提升。
Hadoop在金融行业的应用最为普遍,其可以用它来存储银行业的离线数据,并开发相应的算法对这些数据进行挖掘分析,提高银行企业对历史数据的利用价值。使用基本是保持原有系统架构不变,在核心系统层增加Hadoop平台系统,实现核心系统的历史数据存储备份、数据查询、数据挖掘处理。早在2013年光大银行就基于Hadoop构建起核心历史数据查询平台,可为客户提供联机历史数据查询应用功能,将3-4天的查询时常缩减到当日完成,大大提升运营效率。
开源闭源之争一直没有停止过,一些CIO也和我谈及,去IOE喊了这么多年,真正将核心改造的企业却没有几个,所以只能随着新技术出现来打破一些技术壁垒逐步实现转型,这也是为什么各大公司开始对开源研发和运维加大投入。
开源的路还在继续
对于开源技术CIO们都有自己的考量,除了上文提到了诸多优点,他们普遍认为开源在稳定性和维护性上还有所欠缺。
企业自己利用开源代码来构建一个框架或系统是一个浩大的工程,传统企业不同于互联网公司有着较为丰富的技术实力,但是其中也有一部分大型企业在自己针对开源做开发,例如金融、电信、能源等行业,但调研实施的过程中也会或多或少伴随开源服务提供商的合作和咨询。
而那些中小企业既没有技术做支撑也没有像金融、电信企业一样有几百人的IT团队,所以在开源上的出路基本都是使用商业版本的开源产品。
这样也可以规避刚刚提到开源的一些弊端,但CIO们心里也非常明白,即使使用商业开源自己也还是没有拿到核心控权。而且开源服务价格并不低,这也是很多企业没有使用的原因之一,但一些开源IT提供商可能并不这么认为。
毋庸置疑,开源是一个难啃的骨头,但是还是有越来越多的企业投身于此,尤其是创业型企业,他们迅速的获得了ABCD轮,但其实真正的开源市场走向并不是几家IT厂商可以把控。就如同前一阵OpenStack的唱衰论,刺激了不少国内创业型开源服务商,虽然Gartner分析师进行了辟谣,但是到2020年全球OpenStack整体市场规模达到30亿美元,盘子也并不算大。
在开源的市场中企业尤其是传统企业在才是这中间真正的推动者,俗话说实践出真知,技术产品服务提供商也不能固守在某项技术中,多听听CIO们心中真正的烦恼,开源市场才能更美好。
“CIO在思考”是“26维自媒体联盟”的创始成员,“26维自媒体联盟”致力成为北半球最靠谱的企业级科技自媒体联盟。
长按二维码,选择“识别图中二维码”即刻关注
好文章,需要你的鼓励
Amazon旗下秘密研发机构Lab126新成立团队,专注在机器人上嵌入自主代理AI,实现通过自然语言完成复杂任务,从而提升仓储物流与配送效率,同时开发高精度地图技术。
这项研究介绍了一种新型多模态扩散模型,能够同时生成量子电路的离散结构和连续参数。由因斯布鲁克大学和NVIDIA公司研究人员开发,该模型利用两个独立但协同工作的扩散过程处理门类型选择和参数预测,克服了传统量子电路编译方法的效率瓶颈。研究证明了该模型在不同量子比特数量、电路深度和参数化门比例下的有效性,并通过快速电路生成创建了数据集,从中提取出有价值的结构见解,为量子电路合成提供了新方向。
SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别器提升生成质量。实验表明,SenseFlow能将SD 3.5和FLUX等12B参数级模型成功蒸馏为仅需4步生成的高效版本,同时保持甚至超越原模型在多项指标上的表现,代表了AI图像生成效率提升的重要突破。