10.1 动机
10.1.1 大数据的来源和使用
10.1.2 大数据查询
10.2 大数据存储系统
10.2.1 分布式文件系统
10.2.2 分片
10.2.3 键值存储系统
10.2.4 并行和分布式数据库
10.2.5 复制和一致性
10.3 MapReduce范式
10.3.1 为什么要使用MapReduce
10.3.2 MapReduce示例1:词汇统计
10.3.3 MapReduce示例2:日 志处理
10.3.4 MapReduce任务的并行处理
10.3.5 Hadoop中的MapReduce
10.3.6 MapReduce上的SQL
10.4 超越MapReduce:代数运算
10.4.1 代数运算的动机
10.4.2 Spark中的代数运算