至顶网CIO与应用频道 12月15日 评论消息(文/孙博): “Pivotal就是要在短时间里推动云计算时代的整个新企业IT软件生态发展,最终达到可以取代或与上一代企业IT软件平等的市场地位。”这是近期采访一家成立四年,来自硅谷的企业Pivotal,其中国研发中心总经理冯雷告诉记者他们的历史使命。冯雷还说,他希望将硅谷精神带到国内的各个角落,加速中国企业的数字化转型。
Pivotal中国研发中心总经理冯雷
走向软件化道路
Pivotal,一家于2013年4月,由EMC、VMWare、GE共同投资成立了“富二代公司”。Windows之父、前VMWare CEO Paul Mauritz掌舵,致力于为企业级用户打造企业级云和大数据平台。冯雷说,从Pivotal中国研发中心成立至今,他们的估值已达到28亿美元,在全球共组建了21家办公室,并拥有2500名左右的员工。四年时间,他们还吸引类似像GE工业互联网、福特数字汽车等金融科技,建立在Pivotal云和大数据的平台上面。
可能很多人都不太了解Pivotal,但做过开发的人用到最多的Spring以及衍生框架、做缓存Redis、消息队列框架RabbitMQ、Greenplum,这些都是Pivotal公司的。并且Pivotal中国研发中心在国内是有一支很强技术实力的队伍的,主要分布在北京和上海,其中也不乏顶级开发者。
谈到当初Pivotal董事长决定成立这家公司的原因,冯雷侃侃而谈……在PC时代,开发和使用软件的方式已经与此前大型机时代截然不同。在云时代,Paul Mauritz也看到了类似的下一个机会,即在云计算到来的时候,向企业输出一套方法论,加上对应的软件,来帮助更多的世界500强企业走向数字化、软件化的道路。
世界500强企业是《财富》杂志每年发布的衡量全球大型公司最著名、最权威的榜单。今年的榜单,互联网公司占据了其中的6个席位。一批非行业的新兴公司兴起,也在慢慢抢着大型传统企业的风头。传统企业要想继续保持优势地位,关键还得走好数字化道路。
冯雷说,不同以往的是,在数字化进程中,企业越来越把软件和数据作为核心竞争力,所以企业必然会开发适合自己的软件,以此建立一个竞争的壁垒。这就意味着,企业需要一套新型软件开发模式, 而这也是Pivotal为世界500强带来的价值。“与Pivotal合作,短短几个月就能达到较高的软件开发水平。”冯雷强调,现在约有超过三分之一的世界500强企业在Pivotal Cloud Foundry上迁移并构建新应用,以及在Pivotal Greenplum和Pivotal Gemfire上进行高级分析,利用Pivotal实验室的敏捷、精益创业方法论部署新应用。
十几万美元带来的效果
提到Pivotal,就不得不提到Greenplum。随着数字化时代数据的不断膨胀,采取MPP架构的数据库系统可以对海量数据进行管理。而开源无共享大规模并行处理(MPP)数据仓库Greenplum,支持50PB级海量数据的存储和处理,将来自不同源系统的、不同部门、不同平台的数据集成到数据库中集中存放,并且存放详尽历史的数据轨迹,业务用户不用再面对一个又一个信息孤岛,也不再困惑于不同版本数据导致的偏差,同时对于IT人员也降低管理维护工作的复杂度。
最近几个月发布的Greenplum5,则是一款全新的、敏捷迭代和支撑关键业务出色的数据分析平台。通过跨云部署、集成分析和快速创新等新功能的演进,帮助企业利用数字化手段构建企业间的竞争壁垒。
·跨云平台数据分析
与传统企业数据仓库(EDW)和新的“云”数据仓库不同,Greenplum数据平台中的所有优化都是在软件中进行的,而不是在专有的硬件或网络配置上。 这使得Greenplum 5成为一个灵活、强大且与基础设施无关的平台,能够运行于各种环境中。其中包括所有公有云、私有云和内部专用硬件的部署。
·集成分析:机器学习、图形计算、地理空间数据分析等
与传统的EDW和新的替代方案不同,Greenplum 5中开源的并行机器学习和图形分析、开源的并行地理空间分析、并行文本分析、通过过程语言扩展(PL / X)支持流行的Python和R分析库、使用 Greenplum-Spark Connector(GSC)支持Spark等新功能,将传统分析和高级分析集成在一个可横向扩展的平台中,消除了数据分析孤岛。
·快速创新
在新版本中,Greenplum 5将3000多个PostgreSQL改进功能合并到内核中,并提供了许多新功能,包括性能提升、支持JSON和用于半结构化数据的HSTORE,支持更多原生数据类型(例如通用唯一标识符(UUID)) 和用于高级地理空间分析的光栅地理空间模块。并且,参照PostgreSQL将Greenplum开源,企业可以完全控制部署的软件,无供应商锁定,同时又能对产品方向产生明显的影响。此外,Pivotal Greenplum研发团队采用了Pivotal的敏捷开发实践(小型/专注团队,结对编程,测试驱动开发和持续集成),大大增加了创新的速度。
“Greenplum可以很好地帮助企业用简单的方法建立一个机器学习模型,并从中获得洞察,让企业用户流失率下降三到五个点、用户转化率上升个5个点、推介的准确率提升十或二十个点。”冯雷说,这就是Greenplum 5发挥的重要的作用。不用30万美元雇佣一个卡耐基梅隆博士,花费十几万美元的Greenplum 5也能达到同样的效果。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。