至顶网CIO与CTO频道 06月22日 编译:微软公司首席技术官Kevin Scott的成长之路,恐怕很难在如今这个时代重现。他出生于弗吉尼亚州格拉迪斯,那里是个只有数百居民的小镇。他热爱着自己的家人与故乡,甚至从没想过离开这片土地。但命运总是多变,他在七十年代爱上了计算机技术,这股热情也敦促他走出家乡、拥抱外面更广阔的天地。
一个人的发展不光要靠自我奋斗,更需要考虑历史进程。在成长期间,格拉迪斯这样的小城镇工作机会越来越少,但硅谷等技术中心对人才的需求却愈发旺盛。在2003年从弗吉尼亚大学拿到计算机科学博士学位之后,Scott凭借自己出色的论文加入谷歌公司,并在那里出任高级工程总监。2011年,他又离开谷歌加入LinkedIn,并最终晋升至LinkedIn工程与运营高级副总裁。三年半之前,他转而加盟微软并出任CTO职务。他对自己的职业生涯与发展轨迹非常满意,但也有着自己的遗憾,就是被迫远离自己深爱的家乡故土。
在深入考量自己的两难困境之后,他把自己的想法写了下来,并在今年4月出版了与Greg Shaw合著的《重新编程美国梦(Reprogramming the American Dream)》一书。在他看来,“硅谷是个梦幻般的地方,但我们应该有能力在任何地区都创造出机遇与繁荣,而不该被牢牢束缚在那些沿海创新中心城市。”
Scott坚信,机器学习与人工智能将帮助美国的小镇青年们一步步成长为出色的创业者、企业家。这样的变革将使企业进一步降低在小镇雇用员工的负担,配合机器人完成各类技术开发工作。他还希望随着部分企业的蓬勃发展,带动更多偏远地区的年轻人们以技术为动力开创自己的事业,并最终建立起覆盖全国的良性循环。
但要实现这个梦想,首先需要解决一系列基础层面的障碍。Scott指出,“除非我们生活的所有区域都拥有良好的宽带设施,否则根本不可能让孩子接受良好的教育、没办法吸引并挽留真正优秀的从业人员,更不要谈经营企业了。目前,美国有2500万民众没有可靠的宽带接入服务,其中有1900万来自乡镇社区。这肯定是我们需要改善的头等大事。”Scott还提到,风险投资机构也需要加倍努力,着重在非传统区域内投资偏远位置的企业。在这方面,他着重介绍了Steve Case通过“革命资本”发起的“Rise of the Rest See Fund”基金项目。
Scott强调,单靠风险资本的力量恐怕还不够。行业还需要建立起完善的公私合作关系。在Scott看来,“我们应该拥有足够的勇气与执行力,努力借人工智能与机器学习技术之力实现这个目标,而整个国家也有必要将一部分资源投入到这个方向上。我们可以在私营企业、学术机构与政府部门之间建立起良好的合作关系,借此解决符合公共利益的重大问题,例如建立起普惠性质的高质量、低成本医疗保健体系。阿波罗计划不是终点、而应该是起点,我们必须有信心超越历史。”
有些人往往认为人工智能学科太过深奥、太过复杂,年轻人们根本不可能掌握,这可能导致不同代际之间出现知识断层。但Scott对此表示反对,他说:“既然我们人类可以通过沟通实现相互协作,就一定可以教会机器如何解决问题。在如今这个时代,掌握编程或者计算机使用知识的门槛其实比以往任何时候都更低,同时也是最重要、最需要全面普及的一项大政方针。将这套完整的技能组合传授给下一代,将是我们的首要任务。”
Scott和他的妻子还建立起Scott基金会,努力为孩子们创造自给自足、建立事业的机会。Scott本人也坚信掌握技术将是实现成功人生的重要前提,毕竟他自己的日常工作与亲身经历正是这一观点的最好佐证。与许多人感叹人工智能的兴起将消灭大量工作岗位不同,Scott认为人工智能与其他技术的进步同时也会在美国的每一个角落催生出新的业务形式与发展空间,这终将抵消技术迭代所带来的负面影响。
好文章,需要你的鼓励
Docker公司发布重大新功能,旨在简化智能体AI应用的构建、运行和部署。公司扩展了Docker Compose工具以支持AI智能体和模型的大规模部署,并推出Docker Offload服务,允许开发者将AI工作负载转移到云端。新功能还支持模型上下文协议网关的安全连接,并与谷歌云、微软Azure等合作伙伴集成。
这项研究首次将在线强化学习成功应用于流匹配模型,通过巧妙的ODE到SDE转换和去噪减少策略,显著提升了AI图像生成的精确度和可控性。在复合场景生成、文字渲染等任务上取得突破性进展,为AI生成领域开辟了新的技术路径。
欧盟发布AI法案实施细则,要求谷歌、Meta、OpenAI等公司承诺不使用盗版材料训练AI,详细披露训练数据来源和模型设计理念。新规还要求公司尊重付费墙和网站爬虫限制,公开训练和推理的总能耗,并在5-10天内向欧盟AI办公室报告安全事件。违规企业可能面临年销售额7%或3%的罚款。
这篇由阿里巴巴集团联合多所知名高校发表的综述论文,系统梳理了统一多模态理解与生成模型的最新发展。研究将现有模型分为扩散、自回归和混合三大类型,详细分析了不同图像编码策略的特点,整理了相关数据集和评估基准,并深入探讨了当前面临的技术挑战。