HDFS基本架构和原理
HDFS设计思想

HDFS架构


HDFS数据块(block)
- 注意: Hadoop2.x,block默认大小是128MB

HDFS写流程
- 创建Distributed FileSystem类
- 询问 NameNode 要写的文件对否存在
- 不存在就写入到 FSDataOutputStream 流中
- 流写出去到一个 DataNode
- …

HDFS读流程
- 客户端向 NameNode 询问 block 的位置
- 按照客户端按照拿到的位置,向不同的DataNode 请求数据
- ……

HDFS典型物理拓扑

HDFS副本放置策略

HDFS可靠性策略

HDFS不适合存储小文件

HDFS程序设计
HDFS访问方式

HDFS Shell命令
概览

HDFS Shell命令—文件操作命令

HDFS Shell命令—文件操作命令

HDFS Shell命令—管理命令

HDFS Shell命令—管理脚本

HDFS Shell命令—文件管理命令fsck

- 查看帮助

- 用法示例

HDFS Shell命令—数据均衡器balancer
- 一般设置10% —— 15% 就差不多了

HDFS Shell命令—设置目录份额

※ HDFS Shell命令—增加/移除节点 ※

HDFS Java
API介绍

HDFS Java程序举例

HDFS 多语言API—借助thrift
thrift执行流程

hadoopfs.thrift接口定义

PHP语言访问HDFS

Python语言访问HDFS

Hadoop 2.0新特性

HA(高可用)与Federation(联邦)

异构层级存储结构
背景

原理


HDFS ACL
背景:现有权限管理的局限性

基于POSIX ACL的实现

HDFS快照
背景

基本使用方法

HDFS缓存
背景

原理

实现情况

总结
