谷歌、Facebook和其他科技公司已承诺尽其所能在互联网上杜绝假新闻。他们正在使用大数据技术来识别假新闻。
几个月前,有人在Facebook上分享了一篇关于一个男人不小心与自己的孙女结婚的文章。两人后来发现了这个亲属关系,但仍然决定在一起。这是一个非常古怪的故事。后来证明这完全是一个虚假的故事。
这不是唯一一个出版的假新闻报道。在过去一年中,出版了许多类似离奇的故事,例如总统候选人希拉里?克林顿的落选是比尔盖茨的阴谋。假新闻传播了一段时间,采用先进技术使传播假消息比以往更容易,但大数据可能是阻止假消息传播的解决方案。
大数据将如何打击假新闻
谷歌、Facebook和其他科技公司已承诺尽其所能在互联网上杜绝假新闻。他们正在使用大数据技术来识别假新闻,识别来自网站的新文章是否伪造的,并征求用户反馈。
Simform Solutions公司的大数据和营销专家Rohit Akiwatkar报道说,大数据和人工智能可以通过以下方式打击假冒新闻:
通过以下方式打击假冒新闻:
·评估网页的准确性和内容
·将事实与更可靠的新闻来源进行权衡
·检查网站域名,Alexa排名,来源和SERP排名,以衡量其声誉
·标记经常用于假新闻内容的煽情词汇
许多工具和事实验证的网站已经可以识别假新闻的内容,如Snopes和Politifact。Google Trends,Hoaxy以及其他几个来源也可以使用。
专家们会集思广益地利用大量数据来解决假新闻问题。大数据博主,后台程序员Tasos Martidis表示,他们正在思考的解决方案之一是比特币背后的认证系统,用于认证新闻来源是否真实。
“这就要求知道一个故事的来源,并从中传播这个故事。事实证明,已经有一项技术可以做得很好:区块链...在这个假消息的背景下应用这样的技术,让人们知道谁创造和传播故事。在任何特定的时刻,如果一篇新闻文章被检查过并被发现是错误的,我们就能知道它的来源和发行者。”
至少有一家创业公司正在开发一个区块式解决方案来打击假新闻发布商,并宣布正在使用区块链技术来识别假消息,并与Facebook和其他发行商合作。他们的平台奖励研究新闻内容的用户,采取行动打击假新闻。他们认为社交媒体网络不能自己打假,所以他们需要依靠用户帮助内容评分。
大量用户生成的内容系统依赖用户投票。Digg是第一个,Reddit也在遵循其相同的模式。
Facebook已经根据社会份额开始排名趋势内容。然而,他们的做法并没有减缓假消息传播的速度,因为用户在共享之前很少将内容时行认证。用户订阅系统是独一无二的,它激励用户在投票前进行尽职调查。他们的系统可能被用来通过影响排名算法的Rantic和其他工具来获得共享的内容。Rantic是一个新的工具,可以帮助厂商提升他们在社交媒体上的曝光率。他们拥有一些信誉良好的客户,并关心他们宣传的内容的完整性。
大数据是反对假新闻的最佳武器
在可预见的未来,假消息仍然是一个问题,但至少有一些企业正在实施解决方案。大数据和区块链将帮助他们提高未来几年在线内容的质量。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。