HDFS基本架构和原理
HDFS设计思想
HDFS架构
HDFS数据块(block)
- 注意: Hadoop2.x,block默认大小是128MB
HDFS写流程
- 创建Distributed FileSystem类
- 询问 NameNode 要写的文件对否存在
- 不存在就写入到 FSDataOutputStream 流中
- 流写出去到一个 DataNode
- …
HDFS读流程
- 客户端向 NameNode 询问 block 的位置
- 按照客户端按照拿到的位置,向不同的DataNode 请求数据
- ……
HDFS典型物理拓扑
HDFS副本放置策略
HDFS可靠性策略
HDFS不适合存储小文件
HDFS程序设计
HDFS访问方式
HDFS Shell命令
概览
HDFS Shell命令—文件操作命令
HDFS Shell命令—文件操作命令
HDFS Shell命令—管理命令
HDFS Shell命令—管理脚本
HDFS Shell命令—文件管理命令fsck
- 查看帮助
- 用法示例
HDFS Shell命令—数据均衡器balancer
- 一般设置10% —— 15% 就差不多了