据IBM预测,到2020年将有大约270万个新职位面向精通数据的专业人员开放。根据Glassdoor的预测,这些专业人员的平均薪资为96441美元,在一些城市甚至更高。
如果你的公司正在积极聘请数据科学专业人士,那么好消息是,对内部IT员工进行交叉培训可能是一个成功的策略。根据来自数据科学社区Kaggle的最新报告显示,59%的在职数据科学家将从自学或者在线开放课程中获得相关技能。
作为一位企业培训总监,我曾被要求制订一个“从零开始”的课程,可以培训入门级员工,以及交叉培训更有经验的员工,让他们获得编写股票交易系统代码所需的技能,还包括远程处理引擎、操作系统、数据库、代码库、调用操作、端到端软件开发流程的相关技能培训。
这是一个复杂的任务。目标是能够让一个新培训的人员成为项目的骨干,他/她能够在高要求的环境中立即开始开发代码。
相同的方法也适用于内部数据科学技能的开发。下面就是5个基本步骤:
1、分析公司项目中的任务和技能差距
一个好的起点就是和公司项目负责大数据和分析的负责经理进行沟通。他们的项目有哪些不足?他们在项目中缺少哪些人员配备?需要哪些具体的技术和个人技能?是否有因为缺乏人能够做到而导致项目推迟?根据这些问题的反馈,你可以按照项目列出任务和技能差距的列表。
2、将这些技能与内部员工进行对照
下一步就是评估内部人员,看看谁有能力和背景来承担这些任务和填补技能空白,然后把他们确定为培训的对象。你可以查看公司的个人IT经验,研究员工的以往工作经验,与项目经理一起了解候选人的更多信息,以及他们的才能和兴趣也很重要。
3、设计一个课程,找到一个项目
让你选择的员工在一个孤立的实验环境中开发自身技能,这一定不会奏效的。实验室对于开发技能来说是很好的,但是能够让他们真正地利用这些技能,就要运用于实际的项目中,从而积累经验和自信。
4、不断与项目经理进行沟通
与开发新培训员工的项目经理保持沟通,以便你了解项目进展情况。这让你保持与经理的融洽关系。在项目完成之后,与项目经理进行沟通,有助于评估培训及传授给员工的技能的有效性。在这个过程中,你可以发现课程中那些方面是不错的,哪些方面是可以加强的。
5、不断改进课程,以便跟上实际的项目需求
一些项目需求是保持相对稳定的,但有一些项目需求是随着技术和业务变化而变化的。这一点至关重要,如果你正在开展培训,就需要跟上变化的步伐,这样你的培训总能提供项目所需的技能。你可以通过不断评估项目,然后回到课程中,确保培训与项目的需求是同步的。
最终,我要借用Cloudera教育服务部门副总裁Sara Sproehnle的一句话:“你可以很容易地对员工进行交叉培训。这并不是说技术是不可理解的。你只需要把现有的开发者、分析师和管理员集结到一起,对他们进行交叉培训。”
Sproehnle一语中的。如果越来越多的企业IT部门能够把大数据和分析培训掌握在他们自己手中,这个策略才能真正发挥作用。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。