想象一下建造了古代世界七大奇迹之一,然后立即销毁图纸并驱逐所有参与建造的人。现在再尝试重建它。
乍看之下这个想法很荒谬,但这与 IT 行业大范围发生的情况并没有太大区别。
以网络技术领域为例。在 90 年代中后期,行业迎来了成千上万的技术工程师。他们在大学学习课程,为获得认证而努力,不知疲倦地构建了一些地球上最关键但也最复杂的系统。互联网、社交媒体、云计算,以及无数 AI 初创公司的希望都建立在这一代网络工程师奠定的基础之上。
那么,当这一代人退休时会发生什么?人们很容易想到下一代潜在的网络工程师,但这一代人真的存在吗?
如今从大学毕业的人更可能精通 Amazon Web Services (AWS) 和 Azure,而不是边界网关协议 (BGP) 和以太网虚拟专用网络 (EVPN)。他们花在 Kubernetes 上的时间比在路由器或交换机命令行上的时间更多。
当然,在高级员工或技术文档的支持下,他们也能完成工作。但这个行业以其定制解决方案、特殊工作流程和糟糕的文档而闻名。
这一切都在意料之中。对许多人来说,云计算的部分吸引力在于它给人一种可以将问题推给其他团队的错觉。当然,这并非完全正确。没有公司应该完全放弃架构和运营责任。但在我们行业追求新解决方案的过程中,许多团队都在不言而喻地这样做。
无论如何,当那些有能力管理复杂性的人不再随叫随到时,公司会怎么办?
也许你是个悲观主义者,认为下一代 IT 专业人士的能力不如以前。那些将人类送上月球的 NASA 工程师可能会对现在严重依赖工具进行计算的火箭科学家说类似的话。但是,摆脱了一些底层工作的束缚,正是这些工程师设计出了能够在海洋中间精确着陆的可重复使用火箭,而且无需人工控制。也许关于天体物理学衰落的传言有些言过其实。
构建在昨日的进步之上
今天的科学家能够轻松地在昔日的发现基础上继续发展,这使得这些进步成为可能。在 IT 领域是否也是如此呢?在云计算领域,确实如此。但在通过方法程序 (MOPs) 和标准操作程序 (SOPs) 管理的传统环境中,情况就不那么明朗了。
如果一个熟悉云计算但不精通命令行的新网络工程师试图管理复杂的企业网络,他们甚至不知道从何开始。在一个晦涩语法称霸的世界里,新手几乎没有立足之地。
没有那些表明致力于死记硬背命令的五六个字母的认证,这些人就不具备完成任务的能力。
但认为他们没有能力完全是误解了重点。
对于面临这种未来的公司来说 - 他们的优秀员工将无法找到完全相同的替代者 - 有一个真正的战略问题需要回答:我们应该怎么做?
拥抱未来的运营模式
明智的 IT 领导者会在每次扩展和更新的机会中,将新能力与运营的渐进式改进结合起来。目标必须是满足当前需求,同时稳步迈向未来的运营模式。
重要的是,这种运营模式同时由其支持的技术和对下一代员工的亲和力来定义。
确实,运营应该实现自动化,可观察性应该扩展到所有相关领域,但这些工具也必须对不使用特定供应商语法的人来说很熟悉。
运营模式应该覆盖传统用例,同时利用当前技术。云托管、基于微服务、模型驱动和自然语言都在现代化基础设施和为云原生人才软着陆方面发挥作用。
知道工具需要既能胜任又易于使用,团队应该从扩展需求开始,而不仅仅是运行现有的系统。将运营提升为顶级考虑因素将为未来创造选择性。它显著扩大了招聘范围,并允许采用更先进的云端实践,如多供应商采购和基础设施即代码。
这些考虑因素与运营架构师的角色很相配,许多公司已经依赖运营架构师与网络和云架构师并肩工作。
但也许公司能做的最重要的事情也是最简单的:停止将每一项进步都描述为减少劳动力的推动力。
让负责变革的人感到恐惧会对进步产生寒蝉效应。虽然会有新的团队成员加入,但事实是,现有团队将主要负责克服不可避免出现的障碍。帮助他们成长可以产生两个结果:证明模式是可行的,以及创建必要的培训和文档来连接新旧过渡。
最终,每个公司都必须处理自己的劳动力演变。战略性问题是他们是要有条不紊地进行,还是在危机逼近时才被迫采取行动 - 只有其中一种方式能可靠地产生好的结果。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。