如果你问我,科技圈现在最热的词是什么,那一定是“元宇宙”。
但是回到企业级,我要告诉你的可能还是一个所谓的旧词“数字化转型”。这个2011年就被提出的概念可以说经久不衰,尤其当一个传统企业在面对突发性事件时,如何做到快速调整经营策略,改变组织结构、业务流程,很大程度依赖于数字化的程度。
数字化转型是一个非常庞大和复杂的课题,它既不能用一个简单的技术手段实现,也不是一个单纯的IT项目。而且随着大数据、人工智能、物联网等技术的出现和成熟,数字化转型的边界也一再被拓宽。
“只有以业务为核心,数据为驱动,并且持续改进公司业务模式,企业才能实现真正意义上的数字化转型。”在Teradata天睿公司大中华区总裁王波看来,数字化转型是一个持续不断的自我更新自我迭代,进行优化和改进,并且能够快速适应市场的变化和需求,它是一个长期的、可持续的企业治理战略和系统工程。
Teradata天睿公司大中华区总裁王波
所以数据互联也成为下一代数据创新的关键,需要将跨不同技术、平台的数据整合在一起。这就要求企业的数据架构就要与时俱进,作为平台的Teradata Vantage也在与时俱进,成为一个多云互联的智能数据平台。
数据一直需要被治理
没有数据治理,数据价值就无从谈起。
Teradata委托Vanson Boume展开了一项全球调研,结果显示:中国99%的CIO和CEO认为在重新评估IT投资的时候,云架构的现代化、改善数据管理和分析都是加速数字化转型最重要的投资领域,有97%的中国受访人认为企业应该更加优先考虑数据治理。
王波认为,外部环境的变化对于企业获取数据、管理数据和驾驭数据提出了更高的要求,企业需要重新思考自己的业务战略,重新梳理自己的业务流程,治理自己的数据资产,调整、改进和优化业务模式。
在过去10年间,企业一直在持续开展着数据治理,但是并没有取得很好的结果,一方面是因为条件还不成熟,主要因为IT和业务一般是分离的;另一方面也受限于技术的成熟度。
现在我们已经具备了研究和实践数据治理的基础,所以数据治理在今天又被重新提上日程。Teradata在整个数据治理实践中有四个重点,即:知、控、取和用。“知”知道数据在什么地方;“控”确保数据的使用以安全为核心;“取”针对异构、多源数据方便互联互通;“用”确保数据的质量。
Teradata通过三个能力建设帮助企业落地数据治理,加速数字化转型,包括数据治理的最佳实践、领先业界的数据平台和引擎,以及开放性的技术和应用生态。
一个多云互联的企业级智能数据平台
Vanson Boume调研显示82%的企业将“未准备好应对云环境”视为企业数字化转型的重大障碍。93%的受访者同意,在重新评估IT投资时,云架构现代化、改进数据管理和分析将是加速数字化转型的主要投资领域。
“Teradata Vantage是一个多云互联的智能数据平台,能够帮助全球领先的企业实现数据互联。”Teradata天睿公司总裁兼首席执行官Steve McMillian说道,大型企业客户每天需要运行10亿次查询,使用数百万个虚拟CPU,每年要处理百万亿字节的数据,这些都要求企业必须要以大的规模来进行数据分析。
Teradata天睿公司总裁兼首席执行官Steve McMillian
Teradata提供企业级多云平台,使得计算和存储分离,以现代架构方式进行分布和部署的同时提供云原生集成,以企业级的大规模进行部署。Teradata天睿公司首席产品官Hillary Ashton指出,现在的Teradata更加开放,客户能够有机地利用更多数据,通过更多合作伙伴的工具实现价值。
Teradata天睿公司首席产品官Hillary Ashton
目前最新的Teradata数据库更新到了17.10版本,支持了对象存储的读写,以及在云端实现了多云部署。
而且Teradata还一直有一个秘密武器QueryGrid,通过其可以将Vantage和其他Vantage环境相连,与Oracle、Hadoop环境连接,实现查询并减少数据的移动。
Teradata的中国加速度
今年是Teradata新10年规划的第一年,Teradata也在切实地从整体业务、合作伙伴、技术平台上进行着转型。
整体业务转型:Teradata向客户传递出一个非常明确的信息,Teradata是一家软件公司,同时是一个基于云的技术平台。
合作伙伴转型:Teradata有三类合作伙伴,第一类是系统集成商,双方一起基于Teradata进行服务和交付工作;第二类是解决方案提供商,让更多的解决方案可以架构在Teradata之上,为客户提供更多业务价值;第三类是经销商,为Teradata提供更多商机。
技术平台转型和开放:Teradata不断在加强两方面的核心能力,一方面是开放性,平台中有越来越多的第三方开源算法;第二方面是实现公有云上的交付,目前已经在AWS、Microsoft Azure、Google Cloud实现部署,下一步将在本地云上做加强和集成。
王波表示,Teradata是一个最佳的数据平台,可以给到企业需要的数据,使用高效的方式训练和部署模型,是Teradata核心价值的体现。
未来Teradata也将不断与合作伙伴展开合作,继续为金融、电信等数据需求强烈的行业进行服务,同时拓展制造、零售和生命科学等潜在行业。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。