“未来一年,客户期望值提高,不确定性增加。”
Adobe(Nasdaq:ADBE)近日发布了2023年数字趋势报告,这是其连续13年对未来一年品牌营销和IT优先事项开展深度调查。这份报告访问了全球9,000多名高管、普通营销人员和代理商员工(其中包括近800名亚太区受访者),探讨了让行业领导者在竞争中脱颖而出的技术投资与战略。
今年的数字趋势报告显示,领先品牌已优先投资于有关内容创作的能力和工作流程,包括提升内容创作速度、规模和效率,以建立更稳固的客户关系,并在2023年取得成功。同时,领先品牌正在加强现有的营销流程和技术,将投资效果最大化,确保把握住全年的每个机会。
Adobe大中华区解决方案顾问总监聂双艺表示:“在充满不确定性的环境中,企业需要积极拥抱大规模个性化体验时代,以满足日益挑剔的消费者对体验的要求。要攻克生产和交付大量个性化内容的挑战,科技和创造力二者缺一不可。内容供应链的搭建将是一条有效的投资方向。”
客户的期待成为主导
多数品牌在满足客户期望方面吃力。调研显示,近9成(89%)的高管认为,客户正在根据自己享受过的最佳的全渠道体验为标准,不断重塑期望值。
73%的高管认为,注重眼前的挑战是需要以牺牲长期规划和战略为代价。76%的机构高管认为,他们的客户更注重虚荣指标或通过季度营收目标来定义成功。81%的高管对经济前景抱以担忧或非常悲观的态度。
大规模内容创作
调研显示,大多数(全球:89%;亚太区:79%)的高管表示对内容的需求显著增加。尽管客户对内容的需求似乎永不满足——他们希望在越来越多的渠道中获得动态的数字体验,但只有少数全球品牌(亚太区:25%)认为自己“擅长”创建和交付数字内容。
行业领导者正在重新思考并简化他们的内容供应链,包括内容活动策划、创作、交付和数据分析。其中,效率和降低成本是重点:62%的全球高管(亚太区:43%)认为,他们已经提高了内容流程的效率。
优化工作流程成为重中之重
在过去,加速内容创作通常要以牺牲员工的时间和自由为代价。近乎一半(全球:44%;亚太区:41%)的营销人员表示缺乏时间来创作是提供卓越客户体验的障碍。此外:
为了解决这个问题并在2023年优化内容创作的流程,领先品牌已将工作流程管理和数字协作作为内容团队的优先事项。
强化当前的技术
对内容和创意工作流程的投入反映了领导者如何优先考虑改进流程和技术,以在当前的经济环境下取得成功。此外,领导企业也十分关注他们现有的技术。约一半(48%)的全球领导者计划在今年最大程度挖掘现有的营销和数据技术的价值。约一半(45%)的亚太区领导者则计划在2023年投资新的营销及数据技术,33%表示会充分挖掘现有技术的价值。
出于对经济方面的担忧,一些品牌的未来规划可能受到影响。76%的代理商高管表示他们的客户专注于短期指标和收入目标。73%(亚太区:65%)的高端品牌高管强调只关注眼下的需求将会牺牲制定长期规划和战略的最佳时机。不过令人鼓舞的是,这种只关注当下需求的企业并不普遍。此外,还有一些受访者表示,他们正在展望新的数字平台和互动形式,22%的全球受访者(亚太区:41%)表示他们所在的组织正在学习利用元宇宙开拓全新的营销模式。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。