ZD至顶网CIO与应用频道 03月09日 北京消息:可视化,被视为大数据落地的最后一公里。就如同人们去商场购物时,看见一件漂亮的衣服,但2000元略贵的标价或许会让部分用户产生犹豫,而可视化充当的作用就相当于给这件衣服贴上了打8折的标签,为最后的决策提供了助力。
在大数据领域,重要的是数据本身以及从中得到的价值,但同时可视化的推动作用,为不同年纪、不同职责的用户采用大数据提供了更好的体验,降低了认知的壁垒。
商业决策离不开互动性的可视化
目前的大数据可视化呈现,大多数以表格、饼图等方式展示,例如用户比较熟悉的支付宝用户的全年消费记录。虽然类似的可视化提供了直观的数据感受,但另一方面,不得不说其呈现的数据信息量有限,内容较为死板,特别是在商业上,难以提供更多的价值或知识。在硅谷领先大数据公司Taste Analytics数据可视化副总裁俞立看来,数据可视化不仅需要提供直观、形象的体验,同时还应该包含重点信息提取、可追踪,以及人机互动性增强两个方面。
“在商业决策上,企业需要的大数据可视化不仅是一张张大致方向上的图表,同时需要在这些图表上进行任意维度的选择,对真正重要、感兴趣的信息进行查找、追踪。”他表示,在最终数据呈现上,现在的可视化大多停留在数据包含哪些场景和要素领域,而对数据中最重要的人事物、数据发送时间地点、用户讨论这些场景与要素的位置等细节却无从追踪,所以企业难以得到更多的知识。
此外,目前国内大多数非结构数据分析产品,包括关键词提取、情感分析、舆情模型分析等,常常采用预先定义文档标签和关键词,来进行分类, 需要人工大量干预。“业界比较前沿的做法,是机器通过一定的规则进行文档自动分类。例如Taste Analytics的Signals平台不用定义标签,借助系统后台的焦点提取功能,通过机器学习和统计归类的方法,自动地提取出数据的分类模型,同时从语义方向分析这些数据。” 俞立,这位在学生时代便一直研究大规模时变数据可视化的博士表示,这类做法的优势在于,不仅人工干预少,可以更智能、客观地分析趋势;并且对于数据科学家等用户,可以在此基础上对分析结果进行调整,加入更多的参数或信息,机器便能重新学习并处理数据,呈现出一个更加准确的结果。
结构化与非结构化数据融合分析
最终可视化结果的准确性与数据分析过程紧密相关。时下,越来越多的企业开始通过第三方平台,或服务外包来实现大数据分析,例如采用Salesforce、Answers Forsee等平台,或借助国内一些厂商的类似服务。尽管提供大数据分析服务的公司不少,但现有产品仍是以结构化数据分析为主,少量非结构化分析产品也是针对语义分析、情感分析、舆论分析等提供单一功能,很少将结构化数据和非结构化数据结合形成一套整体解决方案。
“现在Taste Analytics已可以同时实现结构化数据分析和非结构化数据分析。” 俞立表示。
例如大众点评中用户对万达影城的评论中,详细的语言评论是非结构化数据,环境、服务、视觉效果等评分是结构化数据。Taste Analytics平台将详细语言评论进行自动归类及焦点提取,分析出时间、地点、人物,以及语义焦点(最重要的词语,如负面评价、正面评价);同时在环境、服务、视觉效果评分等结构化数据导入系统后,可以得到具体城市如北京万达影城的环境、服务、视觉效果态度分布,以及基于这个分布用户的评论信息的关键词。通过“结构化数据+非结构化数据”下更多维度的分析,可以得出哪些焦点比较突出,用户为什么给出5分好评或2分差评。
所以这样结构化数据与非结构化数据分析的结合,可以带来更多深入的分析,在可视化呈现上,也不仅能表达出其他数据分析产品展示的“是什么”,同时还能表达出“为什么”。
可视化应同时服务两类用户
“从用户角度看,大数据分析应该越傻越好,越简单越好,人工干预越少越好。”Taste Analytics移动技术总监沈於众说道,尽管如此,但实际上大数据分析产品应该面向不同类型的用户,例如对于数据科学家、分析师,其可能需要更多的观察或与数据间的互动;而对于企业CEO、产品经理等,其需要最终呈现的信息能直击企业痛点,越重要越好。所以Taste Analytics的可视化便是同时服务这两类人群,专业的数据分析师、科学家,以及对数据分析“业余”的决策层人士。
另一方面,在可视化技术实现上,采用SVG和HTML 5已经成为业界事实上的规范。
拥有10年框架设计经验的沈於众表示,现在Taste Analytics的产品便是基于Facebook提出的最新的React.js,通过自己的内部延展而形成高性能、高互动性的实现,“通过统一的人机互动设计、精简的图像可视化阵线,我们Signals平台把复杂的数据分析过程简易化。尤其是当我们的用户可以在平板电脑、手机、PC、笔记本等终端上,以相近的用户体验来随时分析数据时,我们的平台极大程度地提升了客户的数据分析能力和理解能力。”
“我们选择了各种美国先进的网络设计语言,同时编写出了一套自己的优化体系。Signals在最终平台上呈现的效果也算业界领先,所以最终数据可视化的效果、页面相应速度、内存上的优化,在同行里也优势突出。” 沈於众解释道。
目前,Signals平台能够为用户提供10余种图像可视化模式,并且支持客户自定义分析,共包括15种不同的可视化分类。
好文章,需要你的鼓励
GSMA发布《中国移动经济发展2025》报告:预计2030年移动技术对中国经济的贡献将达2万亿美元,移动互联网用户数将增至12.2亿,中国的移动产业数据流量预计将是原来的四倍
OpenAI 宣布重大升级:ChatGPT 现可记忆用户全部历史对话,并据此调整回复。这项功能将使 ChatGPT 随时间更了解用户,提供个性化响应。新功能包括"引用保存的记忆"和"引用聊天历史",目前仅向付费用户开放。虽然提升了实用性,但也引发了隐私方面的担忧。
本文探讨了人工智能聊天机器人对人类情感和关系的潜在影响。作者指出,虽然AI可以模仿关怀,但缺乏真实情感,可能导致人们对亲密关系的期望发生改变。特别是对儿童来说,过度依赖AI可能阻碍情感发展。文章呼吁我们要警惕AI带来的长期影响,保持人际交往的真实性。
AI革命的下一波浪潮不仅仅关乎拥有AI技术,更在于拥有能让AI真正理解业务的人才。虽然媒体关注的是构建大语言模型和复杂AI代理的工程师,但在前瞻性公司的分析部门中,一场悄然革命正在酝酿:AI分析师的兴起。这个角色将成为连接AI技术与业务实践的关键纽带,对企业数字化转型至关重要。