至顶网CIO与应用频道 03月19日 北京消息:很长时间以来,当人们提起程序员的时候就会自然联想到男性形象,而女生选择理工科的时候仍会感到底气不足。你是否发现,即使女性已经在社会中担任了各种各样重要的角色,但生活中仍或多或少仍有一些对于STEM(科学、技术、工程、数学的简称)领域女性的“偏见”,而甚至部分女性自己同样存在误解。近日,全球领先的职场社交平台LinkedIn领英在今年的3月8日妇女节邀请了40余位高中女生,通过职业分享、交流研讨、现场技术体验和信息技术培训,使她们提前感受到大数据分析、光学技术、建筑工程及AI技术应用的相关 “职业体验”。
领英发布的《全球女性职场进步洞察》中显示,过去的四十年中,全球女性在原本男性主导的行业和岗位中呈现良好的进步趋势,STEM领域职场女性增加显著,但软件开发人员变化甚微,女性占比仅超过20%,而女性数据分析师数量则下降了超过 10%。因此,为了给予年轻女孩、青年女性更多机会了解科技领域的职业发展,提升她们的 STEM教育素养,领英的公益组织——LinkedIn For Good(LIFG)携手微软、滨松中国等企业,策划了这场特殊的#MakeWhatsNext 活动,在国际妇女节到来之际,带领高中女生走近STEM,打破传统看法的桎梏,激发她们的未来职业兴趣与追寻梦想的勇气。
除了企业参观和人工智能、光学技术、建筑学等前沿创新技术的原理介绍,这些女高中生们还聆听了多位科技企业女性员工的职业成长故事分享,被“职业榜样”感染,深受启发。而在领英中国北京办公室,领英和微软等公司的企业员工代表分别主持了科学、技术、工程和数学四个独立的“Tech In”趣味沙龙,通过课题讨论、科学作业等互动来引导女学生对STEM职业发展的兴趣。从古希腊建筑修复到大数据的应用,从AI与云端网络到光学组件的研究,现场的女同学们充分展示了自己在STEM领域的潜能。其中,数学组的同学们在领英数据科学家和工程师的帮助下,成功利用领英大数据在30分钟内完成了“海归人才趋势分析”;科技组的同学们完成了被AI赋能的“老年社区”规划,展现了丰富的想象力。
在活动期间,近二十位领英中国的员工成为LinkedIn Coaches项目的志愿者,带来了技术指导和职业经验分享。作为LIFG 2018年重要的公益活动之一,LinkedIn Coaches希望结合领英员工个人技能与平台优势,为求职者、学生、职场新人等需要帮助的人群带去有效的职业指导和帮助。未来,LinkedIn Coaches将继续与这些高中女生保持联系,为她们匹配长期的职业导师(mentor),助力她们的未来成长。
长期以来,领英一直希望为全球每一位劳动者创造经济机会,并致力于连接全球职场人士。LinkedIn For Good(LIFG)团队则面向经济不发达地区和亟需帮助的特殊群体,借助领英全球5.4亿会员及上万名员工的力量,为他们提供取得成功所需的人脉、技能和机会。根据领英大数据统计,有6.2%的领英中国会员拥有志愿经历,平均每人的志愿经历为1.25次,平均志愿服务时长667天,他们为领英在中国践行使命、形成正能量的社会影响力奠定了很好的基础。作为妇女节的系列活动之一,同时也是LIFG在中国的落地后的首个公益倡议,领英希望能够通过这次三八节活动呼吁科技行业消除性别差距,鼓励更多热爱科学的女生有勇气和机会去追求自己的职业梦想。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。