南非特别调查组(SIU)成立于1996年,是一家值得信赖的反腐败、诉讼调查和诉讼机构,负责追回经济损失并纠正不法行为。但是,随着成立时间日久,也出现了技术过时与效率低下的问题。像SIU这样的机构无法容忍这样的问题。
首席信息官Tumelo Zwane明白新兴技术能够如何简化SIU的工作,因此她和她的团队最近着手更新该部门的通信和协作技术。Zwane表示,该项目于2022年初启动,并指出SIU当时仍在使用GroupWise,这是一个支持电子邮件、即时消息和文档管理的平台。虽然还有不少组织在使用GroupWise,但许多组织已选择离开该平台并迁移到更新的技术。
她表示:“从技术的角度看,GroupWise已经无法满足我们的需求,也缺乏我们正在寻找的功能。”这就是他们决定将所有600名用户迁移到微软的原因。此举是SIU更广泛的数字化转型和云迁移战略的一部分,该战略始于大约四年前,旨在将其更广泛的技术堆栈标准化。但是正如她所指出的,他们并没有完全使用云,而是采用了混合策略,因为数据主权法律和治理结构决定了他们可以/不可以在云端存储哪些信息。
进行迁移
当然,这并非易事,特别是考虑到该机构正在处理的数据量就更是如此。她表示:“绝大多数人都把他们的邮箱作为存档工具,这意味着我们的一些用户的邮箱体积非常庞大。”
虽然SIU与托管服务提供商(MSP)就迁移的配置方面进行了合作,并且该合作伙伴为他们提供了指导,但他们最终还是自己进行了实际的迁移。她表示:“我们有想要实现的内部时间表和目标,在我们向市场寻求帮助时得到的回复比我们预想的时间要长得多。”“所以我们对不同需求和最佳方法和途径进行了一些研究和测试,并成功地实现了先决条件,然后自己迁移了所有的内容。”这要求她将她的团队拆解为不同的职能部门,然后提高成员的技能,让他们专注于特定的任务,这样如果用户遇到问题,团队中的某个人就可以提供帮助并解决问题。
在内部完成一切的做法对于确保SIU的运行连续性和组织的可持续性非常重要。她表示:“这是在培养我们自己的人才和能力,让我们在未来能够更自如也更自信地开展类似的项目。”
凡事预则立
首先,他们建议业务部门存档并备份特定数据,以免在切换过程中丢失任何数据。此外,他们还必须考虑在不影响用户访问电子邮件的时间段内进行迁移。因此,他们不得不在夜间完成大部分的工作。
但是时间并不是他们面临的唯一问题。该部门还必须面对不断停电的问题——这是南非电力公司采用的一种方法,通过暂时关闭特定区域的配电来减少能源需求。这显然让数据传输过程变得更加复杂。她表示:“如果你正在迁移大量数据,这时候停电了,你就必须重新开始。”为了应对这种状况,他们密切关注停电计划,以确保数据传输不会中断。她补充表示:“这需要大量仔细的规划和同步资源才能把握好时机”,并且承认这是一个主要但可控的障碍。
事后看来,除了让用户在这段旅程的每个阶段都更积极地参与之外,Zwane的做法没什么可调整的。她表示:“在整个过程中,我们发送了很多信息,但是如果让我再做一次,我会用信息轰炸他们,因为他们并不总是会按照我们的要求行事。”她还补充表示,在迁移前的两到三个月,SIU进行了广泛的培训,但是到了真要行动的时候,有些人还是说自己没得到充分的培训。她表示:“所以我们别无选择,只能又进行了一轮培训。”“让你的用户跟上是非常重要的。沟通和变化管理会让局面大不相同。”
在Zwane看来,迁移带来的最大好处之一是它创建了一个更全面、更具有数字化能力的SIU,他们现在在一个更敏捷的平台上运行,该平台在公共和私营部门广泛使用,这意味着他们的通信工具和协议不再落后于他人。她表示:“微软的平台改变了组织的运作方式,它创造并提高了我们的生产力和效率。”“这缩短了我们调查的周转时间,并确保我们能够更有效地响应我们的任务。”
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。