中易网

Hadoop中怎么查看文件的block size

答案:1  悬赏:10  
解决时间 2021-02-18 02:54
Hadoop中怎么查看文件的block size
最佳答案
因为对控制文件的分片数目,进而控制文件的map个数非常感兴趣,因此有查找如下资料的需求。下面来看看我总结的吧:)

当向HDFS上写文件时,可以通过设置dfs.blocksize配置项来设置文件的block size,这导致HDFS上不同文件的block size是不同的。有时候我们需要知道HDFS上某个文件的block size,比如想知道该该文件作为job的输入会创建几个map等。Hadoop FS Shell提供了一个-stat选项可以达到目的。官方文档描述这个选项时遗漏了可选参数。-stat选项的使用格式是:
{HADOOP_HOME}/bin/hadoop fs –stat [format]

其中可选的format被官方文档遗漏了。下面列出了format的形式:
%b:打印文件大小(目录为0)
%n:打印文件名
%o:打印block size (我们要的值)
%r:打印备份数
%y:打印UTC日期 yyyy-MM-dd HH:mm:ss
%Y:打印自1970年1月1日以来的UTC微秒数
%F:目录打印directory, 文件打印regular file

当使用-stat选项但不指定format时候,只打印文件创建日期,相当于%y:
[hadoop@cMaster hadoop-2.5.2]$ bin/hadoop fs -stat /filein/file_128M.txt15/03/18 09:47:26 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
2015-01-06 01:43:23

下面的例子打印文件的block size和备份个数:
[hadoop@cMaster hadoop-2.5.2]$ bin/hadoop fs -stat "%o %r" /filein/file_1024M.txt

15/03/18 09:48:25 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
134217728 1

可以看到/filein/file_1024M.txt文件的blocksize大小为128M,有一份。
我要举报
如以上问答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
廊坊到濮阳的车有吗
驻马店市148法律服务中心怎么去啊,有知道地
今天早上起床,感觉后脑勺疼,脖子也很疼,这
盐城市亭湖区利群药店有限公司怎么去啊,有知
为什么新上市的z170系列主板没有只支持n卡sil
总有傻子说奥力给,奥力给什么意思
鸿顺花卉园艺这个地址在什么地方,我要处理点
怎样在电脑中找出最新安装的文件
什么礼物既贵重贵又不贵,还稀奇?
龙之谷手游在拍卖行,公会拍卖竞价时别人出了
超市买的阿胶枣,买是袋子扁的,后来涨袋了,
美乐家是传销还是直销?
とれる、落ちる有什麼区别?都是脱落、掉下的
韩雅韩国百货这个地址在什么地方,我要处理点
不讲道德素质的危害
推荐资讯
我是做外贸,有没有专门的外贸杂志推荐下?
白云飘飘心在燃烧是那首歌中的歌词?
交运集团青岛温馨巴 士新增设636 路公交线路
在北京国税局网购专票后怎么在税控发票软件开
下载知道APP第一时间解决难题 如何关闭老年手
我是一个初中生,今年才十七岁,不知道那儿有
对对联,上联是:夜已深人未眠因何故,求下联
Epson ME OFFICF 620F怎么打印照片?
就是手机屏幕下面那个托盘的那个,就是在托盘
大话2里面我的任务提示里有可以领取11称谓。
为什么开不了,刷机不起作用,咋卡刷小米
非谓语句子
手机登qq时,显示手机磁盘不足,清理后重新登
刺客的套装怎么选啊?