本文是区块链(blockchain)部署系列文章的第二篇。在上一篇介绍中,SearchCIO编辑总监Sue Tray评价了区块链技术对不同行业可能造成的冲击,并且向读者介绍了区块链项目的第一阶段:识别应用场景以及制定全盘的技术规划。在本文中,Troy将介绍后续的三个阶段:概念验证、测试和全面部署。
概念验证
Jeff Garzik是区块链服务供应商Bloq的联合创始人以及比特币的核心开发人员,他介绍了区块链的概念验证阶段——通常为期1到3个月时间。 “你构建一个系统,集成到孤立的沙盒环境中。在这个模拟的环境中,你引入真实的客户数据并观察系统的运行情况。
关键就在于,使用真实的客户数据和交易规模,但不会对客户造成任何影响。”Garzik解释到:“如果提升交易规模,比如每天百万级的量级,你会看到区块链系统是如何以良好的可扩展性来满足用户需求的。”
在2016年与纽约召开的比特币共识大会(Consensus 2016 industry event)上,区块链API开发商BlockCypher的首席执行官及联合创始人Catheryne Nicholson就概念验证的过程发表了自己的观点:“从工程角度说,概念验证并没有严格的定义。总体来说,就是快速试错,比如10个工程师在2个月内完成10个项目,找出可行的路径。”
微软全球战略官Yorke Rhodes和Nicholson都认为,云是进行概念验证的最佳选择。“云计算可以让你快速构建所需的环境,不用担心对现有企业系统的影响。”Rhodes认为:“而且,云还提供了很好的协同环境——如果有多方同时参与的话。” 即便从技术上说公有云能够承载测试工作,绝大多数公司还是会选择在私有环境中进行:“没有任何企业会使用公共的区块链来进行测试,大量的应用案例开发工作将在完全私有的环境里进行。”
区块链的发展和成熟,存在着特定的障碍。在本次大会上,Scott Mullins(基于AWS平台提供金融业务软件开发服务)向IT界发出呼吁,让所有相关方都参与到区块链的概念验证过程中来。 “不要忘了任何需要参与到概念验证的人。比如,第三方的外包团队、第三方监管团队、合规或风险管理团队。”Mullins说:“不要等到概念验证快结束时才想起这些。对于测试过程,你需要来自于各相关领域专业人员的意见和建议。”
德勤的金融业务首席顾问Eric Piscini则对宽泛的概念验证提出异议:“测试失败的原因,很可能就是因为参与方过多、涉及面过广。我的建议是:从小处入手,严格控制区块链带给企业的影响范围。” BlockCypher的Nicholson提醒业界警惕那种冗长的概念验证合同。“我们曾经收到过长达150页的主服务合同。对于一个创业公司来说,这是无法承受的。把这类合同扔到一边吧,我们需要的是一个4到5页的合约,而不是在法律顾问的协助下进行长达数月的协商。”
测试及后续工作
在概念验证之后,就该将真实数据引入到生产系统中。 Garzik认为,这意味着在大概5%的客户身上进行小规模实测。“IT团队在小规模、交互少的用户场景下推进实测工作,确保既能向管理层进行汇报,又能在较低规模上为工程师们提供具有实际意义的参考。” Nicholson认为,实测阶段并不是简单地实现概念验证到实际运营的过渡,而是一个全新的阶段,面临着与概念验证完全不同的需求。
Rhodes认为,一旦习惯了新的软件并对测试过程感到满意,业务端就可能同意在实际系统(而不是云中)中进行区块链的部署。 Garzik认为,于去年12月31日正式上线的纳斯达克Linq系统,就是现实的区块链部署第三阶段案例。“这就是针对真实用户的实测,只是在交易规模方面还比较克制 – 微软或苹果股票的交易量是Linq系统的1万倍。”
“绝大多数企业还没进入到区块链部署的第四阶段。”Garzik表示:“大多数财富500强企业仍处于第二或第三阶段。” 为了开始全局部署区块链技术,仍需进一步的工作。“在实际的生产系统中,规模需要扩展;要让所有的用户都感到满意,要开通相应的服务热线。最根本的是,要能够独立运行和维护。”Nicholson表示。 绝大多数区块链项目都没能真正经历这一阶段的验证。 “真正进入实际运用的区块链技术只有比特币,经历了攻击,以及各种实际场景的测试。”BlcokCypher的Nicholson认为:“其他的区块链产品,尽管炫目,但都还是襁褓中的婴儿。”
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。