准备写个统计单词个数的bash脚本

sh/bash/dash/ksh/zsh等Shell脚本
回复
头像
reverland
帖子: 1317
注册时间: 2011-11-26 15:57
系统: windows xp
联系:

准备写个统计单词个数的bash脚本

#1

帖子 reverland » 2012-05-09 19:03

虽然现在几乎什么都不会,曾经会过的也都忘了。可现在忽然有需求了,想要统计下stardict保存下来的单词中出现次数,再用某种方法可视化出来。
先挖个坑吧。
周末折腾折腾看
托在github上的jekyll博客
Always Look on the Bright Side of Life
头像
月下叹逍遥
论坛版主
帖子: 33994
注册时间: 2010-10-07 14:23
系统: Archdows10
来自: 某系某星某洲某国某省某市
联系:

Re: 准备写个统计单词个数的bash脚本

#2

帖子 月下叹逍遥 » 2012-05-09 19:05

三级c题库必备。。。
浮生七十今三十,从此凄惶未可知
头像
reverland
帖子: 1317
注册时间: 2011-11-26 15:57
系统: windows xp
联系:

Re: 准备写个统计单词个数的bash脚本

#3

帖子 reverland » 2012-05-09 19:35

月下叹逍遥 写了:三级c题库必备。。。

:em25
托在github上的jekyll博客
Always Look on the Bright Side of Life
头像
枫叶饭团
帖子: 14683
注册时间: 2010-06-16 1:05
系统: Mac OS X
来自: Tencent
联系:

Re: 准备写个统计单词个数的bash脚本

#4

帖子 枫叶饭团 » 2012-05-09 19:35

py方便,讨厌bash
头像
reverland
帖子: 1317
注册时间: 2011-11-26 15:57
系统: windows xp
联系:

Re: 准备写个统计单词个数的bash脚本

#5

帖子 reverland » 2012-05-09 19:39

枫叶饭团 写了:py方便,讨厌bash
不会。 :em27
托在github上的jekyll博客
Always Look on the Bright Side of Life
头像
YeLee
论坛版主
帖子: 26406
注册时间: 2008-08-13 8:48
系统: Fundu i64
来自: 东海硇州,一双管钥。
联系:

Re: 准备写个统计单词个数的bash脚本

#6

帖子 YeLee » 2012-05-09 20:59

wc?uniq? :em01
◎当我站在道德的高度上俯视别人的时候,发现自己是多么渺小。
♥执着但不偏激,反对而不排斥,坚决捍卫矛盾体的存在方式。
★★★天气预报★★★
fcitx-yatable一个可以使用的码表输入法
[教程]几个实例攻克软件编译难关
Gentoo Development Guide
字体相关
头像
reverland
帖子: 1317
注册时间: 2011-11-26 15:57
系统: windows xp
联系:

Re: 准备写个统计单词个数的bash脚本

#7

帖子 reverland » 2012-05-09 21:07

总体思路
是先把单词提取出来,然后把重复的削掉,得到个没有重复的列表,这一步用lisp解决
然后对得到的新列表中每个单词统计次数将结果写入某文件,这一步也可以用lisp解决……
然后输入到libreoffice中绘图。。。。
:em06 :em06 :em06
好像没用bash……
托在github上的jekyll博客
Always Look on the Bright Side of Life
头像
reverland
帖子: 1317
注册时间: 2011-11-26 15:57
系统: windows xp
联系:

Re: 准备写个统计单词个数的bash脚本

#8

帖子 reverland » 2012-05-09 21:08

YeLee 写了:wc?uniq? :em01
大概grep
托在github上的jekyll博客
Always Look on the Bright Side of Life
头像
YeLee
论坛版主
帖子: 26406
注册时间: 2008-08-13 8:48
系统: Fundu i64
来自: 东海硇州,一双管钥。
联系:

Re: 准备写个统计单词个数的bash脚本

#9

帖子 YeLee » 2012-05-09 21:17

表示对stardict的记录格式不了解…… :em06 :em06 :em06
◎当我站在道德的高度上俯视别人的时候,发现自己是多么渺小。
♥执着但不偏激,反对而不排斥,坚决捍卫矛盾体的存在方式。
★★★天气预报★★★
fcitx-yatable一个可以使用的码表输入法
[教程]几个实例攻克软件编译难关
Gentoo Development Guide
字体相关
头像
reverland
帖子: 1317
注册时间: 2011-11-26 15:57
系统: windows xp
联系:

Re: 准备写个统计单词个数的bash脚本

#10

帖子 reverland » 2012-05-09 22:05

YeLee 写了:表示对stardict的记录格式不了解…… :em06 :em06 :em06
stardict是一行一个单词,所以uniq很好很强大……

搜到个bash脚本貌似更有普适性

代码: 全选

#!/bin/sh
set -x
echo "enter the filename "
read filename
tr " \011" "\012\012" < $filename |tr -dc "[a-z][A-Z]\012" |sort |uniq -c|sort -nr
set +x
但我还想用lisp实现个 :em20
托在github上的jekyll博客
Always Look on the Bright Side of Life
头像
YeLee
论坛版主
帖子: 26406
注册时间: 2008-08-13 8:48
系统: Fundu i64
来自: 东海硇州,一双管钥。
联系:

Re: 准备写个统计单词个数的bash脚本

#11

帖子 YeLee » 2012-05-09 22:37

膜拜蛋疼帝。 :em70
◎当我站在道德的高度上俯视别人的时候,发现自己是多么渺小。
♥执着但不偏激,反对而不排斥,坚决捍卫矛盾体的存在方式。
★★★天气预报★★★
fcitx-yatable一个可以使用的码表输入法
[教程]几个实例攻克软件编译难关
Gentoo Development Guide
字体相关
头像
reverland
帖子: 1317
注册时间: 2011-11-26 15:57
系统: windows xp
联系:

Re: 准备写个统计单词个数的bash脚本

#12

帖子 reverland » 2012-05-09 23:21

:em18 这名字……
YeLee 写了:膜拜蛋疼帝。 :em70
托在github上的jekyll博客
Always Look on the Bright Side of Life
回复