作为美国卫星电视运营商DISH的执行副总裁、首席信息官,Atilla Tinic负责公司所有付费电视和无线品牌的IT战略、交付和运营,范围覆盖了从拥有25年历史的直播卫星服务DISH Network,一直到诞生于云端的IPTV服务Sling TV,以及智能家居服务OnTech。
Tinic说,几年前DISH开始云之旅,如今所有业务“在基础设施和云方面都步入了自己的轨道”。但他特别强调了云优先的方法,称“所有新技术都是在云中诞生的”。
近日Tinic和我们探讨了云创新和云思维的重要性、人员配备挑战、以及他在这个过程中积累的经验和教训。
关于云端创新:
Atilla Tinic:跟上技术变革的步伐,这一点在我看来是非常重要的,而且我认为,云是关键。这就是为什么我会说,所有新技术都是在云中诞生的。我想说的是,所有传统的商业软件厂商都在努力寻找各种方法来实现平台的现代化,这样他们就可以成为云原生的企业。
不用说,我们所有的技术评估都是在云端进行,这一点很棒,因为这样我们可以快速评估各种能力。通常我们可以进行快速评估,或者利用沙盒环境评估各种能力,让我们在购买之前尝试使用这些能力,真正地去了解这些平台,了解这些平台能给我们带来哪些价值。
我认为这很关键,因为技术在不断地快速变化,我不希望我们被锁定在单一的解决方案中。我想确保我们有一个开放的生态系统,随着技术的持续发展,我们可以相对轻松地更换不同的技术元素。
关于采用云思维:
Atilla Tinic:对于网络提供商来说,思维方式正在发生变化。我们正在摆脱盒子和电缆的思维方式,转变成采用云软件工程的最佳实践。你需要考虑如何构建CI/CD管道,以配置优先的方法集成微服务和API。
我们希望可以随时清除和重建任何功能,不会因计划中断而产生高昂的开销。这可能是一个简单的例子,因为从运营商的角度来看,云和云中网络是最先进的。
即使从传统的IT角度来看,我们仍然需要进行范式上的转变。我们希望避免这样一种陷阱,即对待云就像对待数据中心一样。在数据中心,我们总是会一定程度上进行过度配置,因为我们希望确保有足够的容量和空间,以便在采购设备时能够支持一定的交货时间。但是,借助云,我们可以不断优化使用,以便我们可以根据需要进行扩展,也能在满足业务需求时不断缩减规模。
关于云人才方面的挑战:
Atilla Tinic:在过去的几年里,我们与合作伙伴密切合作,共同创新。这对我们所有人来说,都是一次学习的经历。我们要求他们将很多功能构建到解决方案中,我们希望更快地部署变更事项,希望更多地了解性能情况,希望能够快速识别问题。因此,这对他们来说也产生了真正的需求,需要他们具备更多云和平台工程方面的技能。
有了顾问,我们就可以依靠引入思想领袖,向他们学习,帮助我们了解最佳实践是什么,这让我们能够发展和改善。但是,我们也在一定程度上依赖他们获得资源的弹性。
但最重要的是我们自己的员工。我们一直在努力提高内部能力以支持我们的云基础设施,这包括各种云网络技能、云安全、云架构师、平台工程师等等,我们都需要,这是一个很大的挑战,因为我们并不是市场中唯一在寻找具备所有这些技能的人才的企业。
而且在这个市场上,吸引和留住人才是不够的,我们必须投入资源,帮助员工重新掌握完成工作所需的技能,帮助他们成长为经过认证的云专家。
事后总结的7个经验教训:
不应该低估网络。如果你要构建通向云端的连接或者设置中转网关,那么就需要网络团队在架构和管理上做大量的工作,你要确保这些方面做得很好。
构建环境的时候就要考虑到安全性,而不是事后才想起来。原因显而易见,你要确保设置了恰当的访问权限和防火墙等措施来保护你的环境,这是首要任务。但是当你拥有了标准化的安全流程时,也更容易跟上发展的步伐。
自动化。当你有了自动化,基本上就开始通过自动化强制实施各项标准。这么做不仅有助于安全,实际上还有助于更快速递开展新的开发项目。
实施工具标准化。每个开发团队都很容易选择不同的东西,当你想要跨团队扩展的时候,这就会给你带来挑战。这一点虽然并不一定适合所有人,但请你确保罗列一个工具目录,这个目录中包含了大家希望使用的工具,以避免工具蔓延的问题。
制定一个有关于多云环境的工作计划。即使你并不打算选择多云,也可能会发现,这只是因为你使用的是SaaS或者你正在集成到自己的私有云。因此,请认真考虑和多云相关的网络、数据和安全架构。
成本。让独立团队管理他们的环境很容易,但我真心建议进行集中式的监管。当你处于一种纯消费使用的模式时,成本很容易失控。所以,你需要有强有力的监督。
最后是架构和治理。就像那句古老的格言一样,“三思而后行”。如果你把额外的时间花在前期,我认为从长远来看,你会节省大量的时间和金钱。
好文章,需要你的鼓励
ETH Zürich等机构研究人员提出TrustVLM框架,解决视觉-语言模型预测可信度问题。该方法利用模型中存在的"模态差距",创新性地结合图像到文本和图像到图像的相似度,实现无需重新训练即可大幅提升误分类检测性能。在17个数据集的严格测试中,TrustVLM相比现有方法在关键指标上提升显著,同时改善了零样本分类准确率。此成果为AI系统在自动驾驶、医疗等安全关键领域的可靠部署提供了重要保障。
这项研究提出了个性化安全概念,解决大语言模型对不同用户采用统一安全标准的问题。研究团队创建了PENGUIN基准测试集评估模型在处理高风险场景时的个性化安全能力,并开发了RAISE框架高效获取关键用户信息。实验表明,提供用户背景可使安全分数提高43.2%,而RAISE框架通过平均仅2.7次交互即可提高安全分数31.6%。这一创新方法将AI安全从"一刀切"转向"个性定制",为高风险领域的AI应用提供了新思路。
明尼苏达大学研究团队提出了一种创新方法,通过回合级信誉分配显著提升大语言模型(LLM)智能体的多回合推理能力。传统方法只对整个过程进行评价,而他们的MT-GRPO算法能够精确评估每个决策步骤的价值,就像为每一步提供具体反馈。在维基百科搜索工具使用场景中,该方法实现了100%的工具执行成功率和50%的答案精确匹配率,远超传统方法。这一突破不仅提高了AI在多步骤任务中的表现,也为开发更复杂的AI系统提供了重要思路。
这篇研究介绍了PISCES——一种能精确从大语言模型参数中移除特定概念知识的创新技术。与现有方法不同,PISCES通过解缠器模型识别概念相关特征,直接编辑模型参数,实现了更精准的知识移除。在Gemma和Llama模型上的测试表明,该方法不仅有效降低了目标概念的准确率(低至7.7%),还保持了模型在无关领域的高性能,并显著提高了对"重新学习"的抵抗力。这一突破为AI系统的安全部署和合规使用提供了新的可能性。