至顶网CIO与CTO频道 06月08日 编译:这个世界充满了数据。问题是,很多数据出现在错误的地方。即便有时数据或许不是出现在完全错误的地方,也是出现在数据孤岛上、数据丰富的分析引擎里及其他数据存储库里,那些使用这些数据的应用不一定会相互交流,以至于不能将信息在正确的时间、以正确(安全的,基于特权的)的格式提供给正确的用户。
科技行业解决这种长期困境的办法是开发企业内容管理(ECM)系统。这些ECM软件平台旨在帮助整理、管理、转换和保护数据,使得用户可以访问所需的信息记录去完成自己的工作。
在这个领域的专业厂商包括Alfresco、Documentum、OpenText、Magnolia和Acquia等等。Alfresco公司则喜欢称自己是数字业务平台专家,Alfresco称数字业务平台专家这个标签是鉴于Alfresco旗下广阔的技术堆栈,涵括广泛的软件开发工具、人工智能(AI)和机器学习(ML)的领域。
如果我们认为现在的组织想将内容管理作为自己的策略去管理、连接和保护旗下最有价值的信息并释放业务价值,那么我们应该牢记哪些因素呢?
Alfresco软件首席技术官兼创始人John Newton在Alfresco 现代化 2020活动上做了虚拟主题演讲,他提出,我们可以从过去的经验中学习,利用过去的企业行为特征帮助我们规划未来。
Alfresco软件首席技术官兼创始人John Newton
Alfresco首席技术官Newton表示,“当然,我们知道COVID-19(冠状病毒)大流行促使许多公司更快地进入数字业务状态。但这是一个充满挑战的时代,我们面临着全球衰退。《哈佛商业评论》上发表的研究表明,86%的公司在经济衰退时期未能正确地运作。生产性数字业务之路来自拥有转型广度,而不仅仅是产品和服务,是其他业务各个方面的数字化,从营销到人力资源(HR)等方面。”
Newton表示,有一次一个客户告诉他,他们不需要业务数字化转型策略,他们意识到自己需要数字世界的业务策略,他才焕然大悟。所以其实并不在于一个单一的数字(通常是基于软件的)工具,而是要在整体及全体的层面上进入数字运作。
仔细想想这里发生的事情,Newton表示,只是砍掉某个传统的非数字技术及仅仅发展(或跳进)数字化是不够的。事关需要允许本地化决策(可能通常意味着部门本地化)及确立在增量战略步骤中效果最佳的方法。
Newton再次提到我们可以从过去学习,他指到模式,模式是业务中常见问题的通用解决方案。软件这个词最初源自建筑施工理论(现在的软件也经常说“构建”),软件也采用了相同的方法。模式表露了存在的相互关系、行为动机或用例的发生以及任何工作背后最先存在的意图或目标。
理论上可以说:我们一旦在自己的业务中确定了这些模式,对于帮助我们有序地迈向实现数字化运营之路是非常有利的。
Alfresco也在更新自己的产品,Alfresco今年在自己的堆栈里增加了Alfresco Enterprise Viewer。Alfresco Enterprise Viewer软件主要是用于基于浏览器的查阅、协作注释和修订(即数据编辑)产品。
Alfresco公司表示,用户可以用Alfresco Enterprise Viewer查看(文档、图像、音频和视频等格式的)内容及利用编辑工具和聊天窗口在注释和修订是进行实时协作。Alfresco Enterprise Viewer用的是基于浏览器的方法,说是特别适合那些使用带宽不太稳定的网络的远程工作人士。
Alfresco Enterprise Viewer软件的文档查看性能不错是因为将文档分成多个小的部分进行编码传输,所以很快就可以查看第一页。与典型的文档下载方法不同,Alfresco Enterprise Viewer软件用的方法还具有额外的安全优势,可以避免在浏览器缓存中留下任何可读组件。查看期间还会加上水印,用于防止用户查看文档时“截屏”。
Alfresco的Newton认为,内容(及其内容管理和内容控制)在数字化运营过渡中无可避免地扮演着重要角色。那么企业内容管理(ECM)专家怎么不会呢?他解释说,但是在更广阔的背景下,ECM本身正在发展及成为新的业务组成部分,成为我们的办公场所本身的一部分,我们可以称之为“内容服务”。
Alfresco的Newton表示,“ECM已经发展成内容服务,而我们可以看得更远些。我们能看到内容、流程、软件应用程序开发、消息传递和其他业务实体的融合。对于CIO、企业架构师和数字领导者来说,这意味着他们要将大量时间投入到解决新的数字业务问题上,这就是为什么我认为数字业务是ECM的未来。”
现在的网站非常普及,到处都是数据爆炸,我们的生活和工作的许多方面都“数字化”了,内容这个词本身已成了新的标签,内容不仅仅意味着某些东西,而且还意味着在数字业务新时空里扮演特定角色的东西。
如果你自己的内容都不能令自己动容,那么你的业务可能也就无容足之处了。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。