awk:可否以字节为单位,对一个文件进行遍历

sh/bash/dash/ksh/zsh等Shell脚本
回复
whaha
帖子: 104
注册时间: 2016-07-08 17:43
系统: debian8

awk:可否以字节为单位,对一个文件进行遍历

#1

帖子 whaha » 2017-04-12 11:48

获得一个文件的空格数量

awk '{num=num+gsub(/ /,"")}END{printf num}' filename

也以行为单位,按照字节进行遍历

export LC_ALL=C
awk 'BEGIN{FS=""}{for(i=1;i<=NF;++i)if($i~/[\x20]/){num++}}END{printf num}' test

这种方法,无法数出有多少个 0a .
(wc -l test ;awk '{print NR}' test)都可以,但我讨论的是:可否以字节为单位,对一个文件进行遍历。

因为
export LC_ALL=C
awk 'BEGIN{FS=""}{for(i=1;i<=NF;++i)if($i~/[\x20]/){num++}}END{printf num}' test
是按照字节,以行为单位,进行16进制的遍历。

可否按照字节,以整篇文章单位,进行16进制的遍历。
注意:你可能会说,一行一行跑完不就是整篇遍历了。
我可否将整篇文章连接成一个操作对象?
不可以合并行,合并行后,换行符号删除了。

或者说:我想用awk ,通过匹配 0a的方式来获得一篇文章有多少行?
export LC_ALL=C
awk 'BEGIN{FS=""}{for(i=1;i<=NF;++i)if($i~/[\x0a]/){num++}}END{printf num}' test
这个方法不行,因为awk一行一行操作,每行最后不是 0a .

别提 (wc -l test ;awk '{print NR}' test),我知道。
头像
lilydjwg
论坛版主
帖子: 4249
注册时间: 2009-04-11 23:46
系统: Arch Linux
联系:

Re: awk:可否以字节为单位,对一个文件进行遍历

#2

帖子 lilydjwg » 2017-04-13 11:22

为什么这么执着呢?你的原始需求是什么?
头像
zhw2101024
帖子: 1849
注册时间: 2009-03-28 16:10
系统: Arch debian win7
联系:

Re: awk:可否以字节为单位,对一个文件进行遍历

#3

帖子 zhw2101024 » 2017-04-14 23:05

你遇到的问题是什么?
awk只是用来解决问题的一种手段,不用执着在上面。
不管白猫黑猫抓到老鼠就是好猫,要是狗能抓老鼠,用一用难道能掉块肉吗?
不能要求别人把时间花在凭空制造出的问题上。
如果只是纯技术讨论,最好在开头说明。愿者上钩,才不会浪费真正想解决问题的人的时间。
回复