扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
实时数据分析就是技术界传说中的大王乌贼:确实有公司在做实时数据分析,却难觅其踪迹。
Mixcloud,这一流媒体音频内容的在线平台就是这种神秘生物的一员。这家总部位于伦敦被称作“音频YouTube”的创业公司,不仅使用实时分析以做出快速的业务决策并创造更好的产品,而且在致力于构建一个面向客户的实时数据分析门户网站。Mixcloud首席技术官,也是四个创始人之一的Mat Clayton说,当这个门户网站完成以后, Mixcloud的客户将能够看到是谁在何时收听他们音乐目录。
2008年推出的Mixcloud,为用户提供了一个创建“cloudcasts”的地方,DJ混音,播客,电台节目,甚至原创内容都可上传至该平台上用作在线流媒体和一般消费。(该产品还配备移动应用程序版本和可嵌入其他网站的播放器插件。)正如作家可以通过互联网自行出版他们的作以飨读者, cloudcast控们现在也可以在云平台上播出他们创作的音频。
分析调整
Mixcloud作为一个纯互联网公司,收集了绝对访问用户的相关数据。最初,该公司使用Google Analytics的免费工具来测量基准指标,但是当Clayton和他的团队希望在更细化的级别上分析数据时,却遇到了困难。Google Analytics在深入或分割大量的流量数据时使用了很多估计值。但是他们却不提供那些估计值的区间,Clayton在最近的一次网络研讨会上说到,该区间就是所谓的置信区间,它能够给出估计值的可信程度。这意味着,当Clayton和他的团队加入多个估计值的情况下,总误差可能超过100%。
“就算退一步说,方差也极大。”Clayton说,公司对在这样的信息基础上作出产品决策感到很不安。付费版本的Google Analytics解决了这个问题,他说,但“这明显更加昂贵,我想上一次我看到该费用的时候是六位数字。” 现在Google Analytics仍被用来测量基准指标,但Clayton和他的团队也意识到,随着Mixcloud的扩大(网站现在有超过3万月活跃听众,且可以观测到平均每分钟有三个小时的目录内容被上传),他们需要一个更复杂的分析工具。
“我们决定,我们需要一套系统,更准确,而且能够与我们不断扩大的平台相适应, ”他说。
先进的软件
虽然我们的小高科技团队里有不少工程师,但核心竞争力却不是创建分析平台,Clayton说,所以他开始寻找和引入外部平台。最终他选定了一个相当新鲜面孔的供应商,成立于2009年,据网站称获得几家欧洲顶级风投公司资金注入的Acunu Analytics。 Acunu Analytics依赖与一个开源的NoSQL数据库Apache Cassandra – 该数据库最初由Facebook开发 -目的是要迅速的处理大量数据。
“Cassandra拥有可支持大规模互动Web应用程序的传输实时性能,波士顿Wikibon项目研究员Jeff Kelly,在去年的Cassandra峰会后写道。 “它集合了其存储和访问数据列和超快速嵌入的能力,以及分布式计数器的使用和对固态硬盘的充分利用。”
在前端,Acunu Analytics为用户提供实时的仪表板和即时查询功能。这些仪表板使Clayton和他的团队得以实时了解服务器状态,以及如“跟进”或“播放”等按钮的网站模块运行情况。“如果用户不能点击'播放' - 这确实发生过...... [仪表板] 能够让我们发觉相关指标的飞速下降,从而提醒我们发现问题,”他说。 “然后,我们就可以去调试和修复它了。 ”
实时监控不仅确保了高品质标准在弹指一挥间得以维持,而且它也使Clayton的团队能够测试出各个模块如推荐框,在页面的什么位置最受欢迎。通过移动页面上的这些模块以测试到底是什么触发最大量点击参与,Clayton和他的团队可以梳理出用户友好模块和“最有效点”的位置,然后努力在那些上面“加倍下注”。
“我们处理每天增长200%的点击“关注”的有效用户量,而点击了“关注”的用户又关注了200%的更多其他用户。在网络研讨会上克莱顿说,“这还仅仅是分析应该把每一个按钮精确的放置位置 –放在哪里有用,放在哪里不好用。 ”
Mixcloud也通过使用实时Acunu Analytics技术,在不需要网站离线的情况下推出新产品或网站功能。在 “飞行模式”下进行升级,根据不同的风险级别,向部分用户或全部用户推出新的产品,他说。
关键门户
Mixcloud通过使用数据改进整个产品是整个故事里很重要的一段 – 而公司对分析的应用正书写着更多新的篇章。这其中包括实时分析门户网站,一个让用户可以了解跟踪自己的内容如何在网络上运行的前瞻性个性化产品,据Clayton描述。
“用户上传内容以后,”他说,“实际上在短短几个小时内,该内容就被病毒化传播,或者得到极大的关注,而能够提供给这些用户关于真实情况的清晰数据将会是一件好事,这样用户就可以解决任何出现的问题,把内容推送到正确的网络位置,将注意力集中在正确的地方。
数据爆炸性膨胀是一个困难的问题,他说,“我们如何搞定,是下一个挑战。”
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者