大数据以其巨大的力量进行量化和分析,如今其应用风靡一时。但是,作家和企业家马丁·林德斯特罗姆说,人们可能高估大数据的作用。“大数据是关于过去的分析。”他说,对于我们的社会上在原来的基础上预测未来发展趋势,这是“安全和公认的”。但是这可能不会产生最准确的信息。
与之相反,林德斯特罗姆表示,他是“小数据”的信徒。他在新书中指出小数据对于那些具有“创造性和保存的本能”的企业家是一个方法,这是他们最宝贵的资产。而采用这种方法,他引用了媒体大亨罗伯特·默多克作为一个例子。
林德斯特罗姆说,“默多克曾经一天读了50份或100份报纸,直到他可以真正地了解读者的意图,并打电话给他的编辑说,‘我不喜欢这样的标题,因为我认为读者一定会不喜欢它。’默多克基本上是正确的,正是其运用了自己所有的本能,这使得他的公司独一无二的,因为如果你通过一个俗套的格式,在同一台机器输入相同的数据到,并让相同的人加以分析,你会得到相同的结果。而小数据就是本能,扭曲你的观念,并帮助你从不同的角度看世界。”
林德斯特罗姆姆的方法是一种实践的人类学研究,他到受访者的家中访问,收集他们的态度、信息行为和欲望,以有他们可能没有意识到或没有表达的信息。在多次采访之后,他说,“你就会开始看到一个模式,哪些适合这种模式,哪些不适合这种模式。这是非常明显的。”
他每次家访,在经过主人的许可后,拍摄多达300张照片,并一丝不苟地审查他们装饰的选择,布局和更多的线索。几年来,他访问了无数的家庭,这使他建立了他所描述的一种直觉,“随着时间的推移,你可能不会在那一瞬间看到。
比如,他会通过人们房间摆放的物体来“感知”,也就是说,他们招待客人的房间。“如果某人在房间里有一个巨大的书架,那么他在小时候可能没有受到很好的教育,他通过感觉想弥补这种缺憾。”他说。“我们的生活就是一种平衡,如果感觉失衡就会重新找回平衡。如果你有很多古老的的东西,你可能想表明你是丰富复杂的;如果你有一个大串的钥匙挂在你的裤子,很可能在你孩提时候,从来没有真正的控制权,你想弥补这一切。这并不完全准确,但往往是它是一种直觉,这是你随着时间的推移清楚的表达。为什么我觉得那个人是这样的?这有什么共同点?“
林德斯特罗姆的小数据的方法可能看起来并没有像大数据那么“科学”。但他表示,在这个过程中,客户为其提供了一种有效的感觉。他说,“我不能指望通过对这些企业的首席执行官采访,使其改变他们对企业和市场的整个看法。”
但他并没有要求客户简单地接受他对信仰的分析。相反,他说,思想混合是动手开发的一个假设,通过实践,基于研究的小数据的方法,然后用大数据定量验证它。例如,他发现,冰箱贴的数量与主人的情感有着密切的关系,这几乎是一个隐喻的愿望,希望在以往照片上“冻结时间”。
林德斯特罗姆说,“我现在能做什么,而不是问别人这样的问题,你是如何独立成长的?你有多少朋友?我可以说,‘你怎么将冰箱贴放在冰箱上?’,你你怎么看待你的鞋子?你可以把那些看似不重要的观察细节与大数据结合起来”,就会产生客户想要和需要的不同寻常的见解。
例如,林德斯特罗通过向岳母学习整理衣柜的习惯到如何设计一个早餐麦片的包装。通过汽车为中心的文化来了解北卡罗莱纳州农村和城市郊区文化相互隔离的的情况。
任何企业家可以从小数据中受益,林德斯特罗姆表示开始注意这一切。而越来越多的人低着头,眼睛紧盯着他们的智能手机,我们错过了我们周围的世界的关键信息。“随着时间的推移,这让我更加细心,更加善于观察,因为别人已经变得不那么敏锐,”他说。“我喜欢走相反的路。”
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。