谷歌、Facebook和其他科技公司已承诺尽其所能在互联网上杜绝假新闻。他们正在使用大数据技术来识别假新闻。
几个月前,有人在Facebook上分享了一篇关于一个男人不小心与自己的孙女结婚的文章。两人后来发现了这个亲属关系,但仍然决定在一起。这是一个非常古怪的故事。后来证明这完全是一个虚假的故事。
这不是唯一一个出版的假新闻报道。在过去一年中,出版了许多类似离奇的故事,例如总统候选人希拉里?克林顿的落选是比尔盖茨的阴谋。假新闻传播了一段时间,采用先进技术使传播假消息比以往更容易,但大数据可能是阻止假消息传播的解决方案。
大数据将如何打击假新闻
谷歌、Facebook和其他科技公司已承诺尽其所能在互联网上杜绝假新闻。他们正在使用大数据技术来识别假新闻,识别来自网站的新文章是否伪造的,并征求用户反馈。
Simform Solutions公司的大数据和营销专家Rohit Akiwatkar报道说,大数据和人工智能可以通过以下方式打击假冒新闻:
通过以下方式打击假冒新闻:
·评估网页的准确性和内容
·将事实与更可靠的新闻来源进行权衡
·检查网站域名,Alexa排名,来源和SERP排名,以衡量其声誉
·标记经常用于假新闻内容的煽情词汇
许多工具和事实验证的网站已经可以识别假新闻的内容,如Snopes和Politifact。Google Trends,Hoaxy以及其他几个来源也可以使用。
专家们会集思广益地利用大量数据来解决假新闻问题。大数据博主,后台程序员Tasos Martidis表示,他们正在思考的解决方案之一是比特币背后的认证系统,用于认证新闻来源是否真实。
“这就要求知道一个故事的来源,并从中传播这个故事。事实证明,已经有一项技术可以做得很好:区块链...在这个假消息的背景下应用这样的技术,让人们知道谁创造和传播故事。在任何特定的时刻,如果一篇新闻文章被检查过并被发现是错误的,我们就能知道它的来源和发行者。”
至少有一家创业公司正在开发一个区块式解决方案来打击假新闻发布商,并宣布正在使用区块链技术来识别假消息,并与Facebook和其他发行商合作。他们的平台奖励研究新闻内容的用户,采取行动打击假新闻。他们认为社交媒体网络不能自己打假,所以他们需要依靠用户帮助内容评分。
大量用户生成的内容系统依赖用户投票。Digg是第一个,Reddit也在遵循其相同的模式。
Facebook已经根据社会份额开始排名趋势内容。然而,他们的做法并没有减缓假消息传播的速度,因为用户在共享之前很少将内容时行认证。用户订阅系统是独一无二的,它激励用户在投票前进行尽职调查。他们的系统可能被用来通过影响排名算法的Rantic和其他工具来获得共享的内容。Rantic是一个新的工具,可以帮助厂商提升他们在社交媒体上的曝光率。他们拥有一些信誉良好的客户,并关心他们宣传的内容的完整性。
大数据是反对假新闻的最佳武器
在可预见的未来,假消息仍然是一个问题,但至少有一些企业正在实施解决方案。大数据和区块链将帮助他们提高未来几年在线内容的质量。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。