ZD至顶网CIO与应用频道 01月10日 北京消息:为结构化及非结构化数据进行实时搜索、记录和分析的全球领先软件提供商Elastic于上月10号在北京举办了Elastic 中国开发者大会2016,吸引业界超过350名技术专家到来交流,当中包括来自苏宁、百度、奇虎360、大众点评、斗鱼、趋势科技、折800、58到家、瀚思安信的技术专家。
这个首次由Elastic在中国举办的开发者大会主要围绕 Elastic 的开源产品: Elasticsearch、Logstash、Kibana 和 Beats,探讨在搜索、数据实时分析、日志分析、安全等领域的实践与应用。基于开源的Elastic Stack已于全球获得超过7,500万次的累积下载,当中客户包括联想、华为等有名企业。
大会上,首先由Elastic的工程师介绍Elastic Stack的演变过程,以及最新的Elastic Stack 5.0的功能。来自各大企业的专家也分享了他们在不同领域作为用户的经验回馈。
苏宁利用Kibana和Elastic Stack搭建云迹实时日志分析产品,提供应用、web、防火墙、中间件等日志的实时检索、统计分析、告警,为苏宁1000+系统提供日志的实时检索分析服务。苏宁监控研发中心技术副总监彭燕卿先生表示:「实时分析日志是程序员定位问题非常重要的环节,Elastic Stack对提升日志的安全性及效率致关重要。」
此外,Elastic Stack在电子银行的安全应用亦非常奏效。随着手持设备的不断普及,越来越多人在日常生活中选择使用便利的电子银行,黑客亦如此,总是紧盯这块蛋糕。以“数据驱动安全”为愿景,致力于利用大数据帮助企业解决庞杂、分立的信息安全问题的为名的瀚思(Hansight), 其技术总监李学辉先生表示:「不管哪家银行,只要在做网上银行系统,就得面对每天来自世界各地的恶意访问,虽然金融体系有很完善的安全管控机制,但总会有一些恶意的访问成功登入系统,并且其中一些造成储户损失。银行可利用Elastic Stack通过大数据分析的途径来发现潜在的恶意访问,从而进一步采取行动,避免不必要的损失。」
Elasticsearch 在移动病毒侦测领域亦非常有用。目前移动应用越来越普及,与此同时,大量恶意程式散布于互联网之中,企业需要构建一个病毒分析和检测的平台对大量样本进行分析和检测来保护终端用户以免受病毒的侵扰。趋势科技高级研发工程师李啸先生说:「我们利用Elasticsearch分析移动病毒的特征,并设计基于elasticsearch的病毒特征库,写下特定指令来监控和检测病毒。」
Elasticsearch 同时亦加快SparkSQL的查询速度。 SparkSQL对查询的SQL,需要扫描全部的数据,然后获取满足查询条件的记录。如果在海量的数据中,命中的记录个数比较小,查询的时间主要在读取数据。奇虎360李振炜先生指出:「奇虎360对于每一个SQL查询,提取出索引字段的查询条件,然后通过Elasticsearch得到满足条件的记录的路径,Spark直接读取记录,实现了海量数据的查询,秒级响应。」
谈到搜索服务,斗鱼大数据工程师白凡先生亦和议道:「我们在斗鱼主站、鱼吧、点播系统、移动端等搜索项目中均应用了Elasticsearch,已成为公司的核心服务。」
最后,百度大数据部高级工程师高攀先生也分享其公司如果利用Elasticsearch 增加权限管理系统、支持跨机房数据同步、支持多租户资源隔离和解决数据一致性问题。
总括而言,出席这次开发者大会的技术人才也认为开源为业界趋势,而ElasticStack亦为一个在不同领域应用很不错的选择。值得讨论的是,单靠开源软件是否足够,还是需要一些配套以发挥开源软件的所有潜能。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。