Skip to main content

大数据简论

10.1 动机

10.1.1 大数据的来源和使用

10.1.2 大数据查询

10.2 大数据存储系统

10.2.1 分布式文件系统

10.2.2 分片

10.2.3 键值存储系统

10.2.4 并行和分布式数据库

10.2.5 复制和一致性

10.3 MapReduce范式

10.3.1 为什么要使用MapReduce

10.3.2 MapReduce示例1:词汇统计

10.3.3 MapReduce示例2:日志处理

10.3.4 MapReduce任务的并行处理

10.3.5 Hadoop中的MapReduce

10.3.6 MapReduce上的SQL

10.4 超越MapReduce:代数运算

10.4.1 代数运算的动机

10.4.2 Spark中的代数运算

10.5 流数据

10.5.1 流数据的应用

10.5.2 流数据查询

10.5.3 流上的代数运算

10.6 图数据库

10.7 总结