分页: 1 / 2

求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-28 21:36
hanyu120
使用shell编程统计文本A.txt中的8种Structure 各自的数量,然后将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID,结果放在文本B.txt中

文本A.txt:
Residue Structure
1A H
2A H
3A S
4A S
5A S
6A S
7A S
8A S
9A E
10A E
说明:Residue:有数字和字母组成
Structure 共8种:H B E G I T S (最后一种是空格)

文本B.txt(统计结果):
H B E G I T S 空格
2 0 2 0 0 0 6 0

Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 S 3A 8A
4 E 9A 10A
说明:统计出8种STRUCTURE各自的数量
然后将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID。

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 2:33
astolia
一看就是某课程的作业,自己解决吧。awk或grep+wc+head+tail+cut都可以实现

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 9:36
hanyu120
astolia 写了:一看就是某课程的作业,自己解决吧。awk或grep+wc+head+tail+cut都可以实现
你好,这是我的作业,我用从C++可以实现。因为刚接触shell,做这个做了很久,没做出来,所以我想请大虾帮我用shell实现,作为我入门的一个研究实例。谢谢

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 9:51
trigger
第一问

代码: 全选

#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 9:59
trigger
第二问给你个思路吧
for i in "H B E G I T "
do
grep $i ufile|cut -f1 -d" " | sed列转行 | awk取首尾
#或awk水平高点,这里只用awk也能做到
done

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 10:01
hanyu120
trigger 写了:第一问

代码: 全选

#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
大虾,你统计出8种STRUCTURE各自的数量,后面还有一步,要求将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID。
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 S 3A 8A
4 E 9A 10A

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 10:09
trigger
hanyu120 写了:
trigger 写了:第一问

代码: 全选

#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
大虾,你统计出8种STRUCTURE各自的数量,后面还有一步,要求将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID。
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 S 3A 8A
4 E 9A 10A
这就是我说的第2问,自己想想

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 10:29
hanyu120
trigger 写了:第一问

代码: 全选

#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
大虾,A.txt 的 Structure若为如下,统计不出空格出现的次数
Residue Structure
1A H
2A H
3A
4A
5A S
6A S
7A S
8A E
9A E
10A E

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 10:48
trigger
hanyu120 写了:
trigger 写了:第一问

代码: 全选

#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
大虾,A.txt 的 Structure若为如下,统计不出空格出现的次数
Residue Structure
1A H
2A H
3A
4A
5A S
6A S
7A S
8A E
9A E
10A E
这点事应该很好自己解决啊

代码: 全选

#!/bin/bash
for i in H B E G I T S K
do
echo -n $i" " && sed 's/ $/K/' file|grep -c $i$
done|uniq

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 10:53
eexpress
没看懂。给实例。一分钟搞定

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 11:34
hanyu120
eexpress 写了:没看懂。给实例。一分钟搞定
要求:将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID,结果放在文本B.txt中
文本A.txt:
Residue Structure
1A H
2A H
3A
4A
5A
6A S
1B i
2B i
3B E
4B E
5B E
说明:Residue:有数字和字母组成,字母A表示A链
Structure 共8种:H B E G I T S K(K表示空格)


文本B.txt(统计结果):
A链
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 K 3A 5A
3 S 6A 6A
B链
Number Structure Start_Residue_ID End_Residue_ID
1 i 1B 2B
2 E 3B 5B

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 11:42
hanyu120
trigger 写了:第二问给你个思路吧
for i in "H B E G I T "
do
grep $i ufile|cut -f1 -d" " | sed列转行 | awk取首尾
#或awk水平高点,这里只用awk也能做到
done
大虾,第二问有两条链,麻烦了
要求:将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID,结果放在文本B.txt中
文本A.txt:
Residue Structure
1A H
2A H
3A
4A
5A
6A S
1B i
2B i
3B E
4B E
5B E
说明:Residue:有数字和字母组成,字母A表示A链
Structure 共8种:H B E G I T S K(K表示空格)


文本B.txt(统计结果):
A链
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 K 3A 5A
3 S 6A 6A
B链
Number Structure Start_Residue_ID End_Residue_ID
1 i 1B 2B
2 E 3B 5B

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 12:13
trigger
hanyu120 写了:
trigger 写了:第二问给你个思路吧
for i in "H B E G I T "
do
grep $i ufile|cut -f1 -d" " | sed列转行 | awk取首尾
#或awk水平高点,这里只用awk也能做到
done
大虾,第二问有两条链,麻烦了
要求:将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID,结果放在文本B.txt中
文本A.txt:
Residue Structure
1A H
2A H
3A
4A
5A
6A S
1B i
2B i
3B E
4B E
5B E
说明:Residue:有数字和字母组成,字母A表示A链
Structure 共8种:H B E G I T S K(K表示空格)


文本B.txt(统计结果):
A链
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 K 3A 5A
3 S 6A 6A
B链
Number Structure Start_Residue_ID End_Residue_ID
1 i 1B 2B
2 E 3B 5B
首先处理全部文本,然后正则[0-9]A和[0-9]B区分一下,最后分别编号

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 12:40
eexpress
模模糊糊的。大概这意思吧。

代码: 全选

2010-09-29 12:39:19 三 ~ 
● cat t.pl
#!/usr/bin/perl

$os="X"; $ot="X";
while (<STDIN>){
chomp;
($t,$s)=split "\ ", $_;
if($s!~/$os/){
print "$ot\n$s\ $t\ ";
}
$os=$s;$ot=$t;
}
2010-09-29 12:39:30 三 ~ 
● cat t
1A H
2A H
3A K 
4A K
5A K
6A S
1B i 
2B i 
3B E
4B E
5B E

2010-09-29 12:39:32 三 ~ 
● cat t|perl t.pl
X
H 1A 2A
K 3A 5A
S 6A 6A
i 1B 2B
E 3B 5B

Re: 求助:shell脚本编程统计文本A.txt中的信息

发表于 : 2010-09-29 13:02
trigger
就知道ee会用perl :em04