去年,陶氏化学(Dow)在更好地利用数据方面,迈出了大胆的一步。为了消除孤立的数据孤岛,同时更好地利用商业智能并作为一项企业资产,陶氏公司成立了一个内部组织,将IT和公司全球业务部门无缝集成到一个部门下。
这个部门被命名为业务数据服务部(Business Data Services),它的作用有点类似于自行车车轮,以IT为中心,辐射到陶氏公司的业务部门、区域部门和职能部门。陶氏公司创建该组织的最初目标是为了加速数字业务流程工具和服务的交付,提高这些工具和服务的采用率,以实现更强大的业务成果。
陶氏公司首席数据官Chris Bruman解释说,这家有着125年历史的公司,仍然在不断进行变革以满足变化的市场需求,把人工智能和机器学习等赋能技术融入进来,这种集成的、协作式的方法,已经改变了IT部门关于哪些数字解决方案适合陶氏公司的IT决策方式。
关于保持专注:
当前,我们面临的外部干扰和各项挑战,可能比以往任何时候都更加强调了把数据作为基本优先事项的必要性。但我们必须严格地对特定领域进行优先级排序,而不要因为某个突发奇想过于分心——要缩小范围并保持专注,而不是好高骛远。
我更倾向于划定几个对业务有影响的重点领域,在这些领域做出重大改进,而不是一头扎进数百个领域却几乎没有什么进展。我们通过专注于与业务目标一致的若干领域,为公司、我们的客户和我们的员工赢得了胜利。我们凭借经过验证的能力,我们开始更多地了解什么会产生最大价值,如何才能更快速地采用以获得更高价值。因此可以说,保持精专就是我们眼下的一大主题。
关于创建数据枢纽:
2020年底,我们开始考虑在数据质量和数据治理方面采取新的方法。我们开展了很多方面的工作,包括报告、数据迁移、数据管理等等,希望将这些数据都整合在一起,为公司打造更强大的数据枢纽。因此,我们在2021年第二季度发布了Business Data Services。
陶氏公司的大多数数据并不归属于IT部门。其他几个业务职能都要对这些数据负责,如果管理不善,这些数据很快就会变得分散零碎。作为数据枢纽,我们致力于实现治理便利性、更好的流程、带来更易于使用的工具,但是在数据清理和长期数据维护方面,要依赖于业务部门、职能部门和区域组织。这种模式很重要,因为这样IT部门就可以为公司内的所有数据所有者提供有用的指导和最佳实践。
关于利用人工智能和机器学习:
今天,当我们把数据从一个位置移动到另一个位置,或者从一个工具转移到另一个工具的时候,会有很多数据清理相关的操作。这个时候,我们就要进行大量的手动检查,而机器学习可以对这些手动操作实施自动化来帮到我们。未来,我们只需要给出一份有关于需要验证哪些异常情况的报告,而不用让某个员工在周末的时候来检查数据。这样,通过自动验证数据来查看数据是否准确和干净,就能让员工只需花费30分钟而不是周六的6个小时。
陶氏公司和其他各行各业的公司一样,把ESG和可持续发展视为企业的当务之急。因此,我们将继续寻找机会,利用人工智能和机器学习来实现这个重要领域中某些数据管理任务的自动化。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。