扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢?
学习大数据的最佳方法就是先从了解信息系统是如何工作着手,尤其是数据库和基础设施。同样在开始前还需要了解大数据工具,如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。
系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能包含了各种来源的结构化数据和非结构化 数据——数据仓库、Hadoop、NoSQL、内存数据、文件以及应用程序——所以你必须学会组织数据,以便系统有效的处理他们。确保你的主数据一致性, 以避免出现多个版本的数据——多个不同步的数据库。
数据保护同样重要;要熟悉组织的数据安全处理过程,同样还需要了解安全、合规性以及治理流程。根据数据敏感程度的不同、考虑屏蔽、编校或加密保护。
大数据源的定义
在接触这个项目之前的最后一步,考察客户对服务质量的要求。他们需要分析多大的数据,以及这些数据的响应速度。例如,对于大型数据库,近乎实时响应的需求会 需要将其放置在内存或者闪存缓存中。IBM的BLU Accelerator 和SAP HANA都十分适合在内存中快速读取的应用场景。此外,理解你用户的预期结果——他们正试图得到的答案。如果你知道他们需要的结果,就可以组织数据与系 统,以更有效的达到目标。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者