分页: 1 / 2
求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-28 21:36
由 hanyu120
使用shell编程统计文本A.txt中的8种Structure 各自的数量,然后将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID,结果放在文本B.txt中
文本A.txt:
Residue Structure
1A H
2A H
3A S
4A S
5A S
6A S
7A S
8A S
9A E
10A E
说明:Residue:有数字和字母组成
Structure 共8种:H B E G I T S (最后一种是空格)
文本B.txt(统计结果):
H B E G I T S 空格
2 0 2 0 0 0 6 0
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 S 3A 8A
4 E 9A 10A
说明:统计出8种STRUCTURE各自的数量
然后将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID。
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 2:33
由 astolia
一看就是某课程的作业,自己解决吧。awk或grep+wc+head+tail+cut都可以实现
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 9:36
由 hanyu120
astolia 写了:一看就是某课程的作业,自己解决吧。awk或grep+wc+head+tail+cut都可以实现
你好,这是我的作业,我用从C++可以实现。因为刚接触shell,做这个做了很久,没做出来,所以我想请大虾帮我用shell实现,作为我入门的一个研究实例。谢谢
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 9:51
由 trigger
第一问
代码: 全选
#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 9:59
由 trigger
第二问给你个思路吧
for i in "H B E G I T "
do
grep $i ufile|cut -f1 -d" " | sed列转行 | awk取首尾
#或awk水平高点,这里只用awk也能做到
done
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 10:01
由 hanyu120
trigger 写了:第一问
代码: 全选
#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
大虾,你统计出8种STRUCTURE各自的数量,后面还有一步,要求将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID。
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 S 3A 8A
4 E 9A 10A
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 10:09
由 trigger
hanyu120 写了:trigger 写了:第一问
代码: 全选
#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
大虾,你统计出8种STRUCTURE各自的数量,后面还有一步,要求将相同structure的归为一行,标明Start_Residue_ID和End_Residue_ID。
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 S 3A 8A
4 E 9A 10A
这就是我说的第2问,自己想想
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 10:29
由 hanyu120
trigger 写了:第一问
代码: 全选
#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
大虾,A.txt 的 Structure若为如下,统计不出空格出现的次数
Residue Structure
1A H
2A H
3A
4A
5A S
6A S
7A S
8A E
9A E
10A E
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 10:48
由 trigger
hanyu120 写了:trigger 写了:第一问
代码: 全选
#!/bin/bash
for i in `cut -f2 -d" " lines2`
do
echo -n $i" " && grep -c $i$ lines2
done|uniq
结果:
H 2
S 6
E 2
我就不排版,不补0了
大虾,A.txt 的 Structure若为如下,统计不出空格出现的次数
Residue Structure
1A H
2A H
3A
4A
5A S
6A S
7A S
8A E
9A E
10A E
这点事应该很好自己解决啊
代码: 全选
#!/bin/bash
for i in H B E G I T S K
do
echo -n $i" " && sed 's/ $/K/' file|grep -c $i$
done|uniq
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 10:53
由 eexpress
没看懂。给实例。一分钟搞定
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 11:34
由 hanyu120
eexpress 写了:没看懂。给实例。一分钟搞定
要求:将相同
structure的归为一行,标明Start_Residue_ID和End_Residue_ID,结果放在文本B.txt中
文本A.txt:
Residue
Structure
1A
H
2A
H
3A
4A
5A
6A
S
1B
i
2B
i
3B
E
4B
E
5B
E
说明:
Residue:有数字和字母组成,字母A表示A链
Structure 共8种:H B E G I T S K(K表示空格)
文本B.txt(统计结果):
A链
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 K 3A 5A
3 S 6A 6A
B链
Number Structure Start_Residue_ID End_Residue_ID
1 i 1B 2B
2 E 3B 5B
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 11:42
由 hanyu120
trigger 写了:第二问给你个思路吧
for i in "H B E G I T "
do
grep $i ufile|cut -f1 -d" " | sed列转行 | awk取首尾
#或awk水平高点,这里只用awk也能做到
done
大虾,第二问有两条链,麻烦了
要求:将相同
structure的归为一行,标明Start_Residue_ID和End_Residue_ID,结果放在文本B.txt中
文本A.txt:
Residue
Structure
1A
H
2A
H
3A
4A
5A
6A
S
1B
i
2B
i
3B
E
4B
E
5B
E
说明:
Residue:有数字和字母组成,字母A表示A链
Structure 共8种:H B E G I T S K(K表示空格)
文本B.txt(统计结果):
A链
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 K 3A 5A
3 S 6A 6A
B链
Number Structure Start_Residue_ID End_Residue_ID
1 i 1B 2B
2 E 3B 5B
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 12:13
由 trigger
hanyu120 写了:trigger 写了:第二问给你个思路吧
for i in "H B E G I T "
do
grep $i ufile|cut -f1 -d" " | sed列转行 | awk取首尾
#或awk水平高点,这里只用awk也能做到
done
大虾,第二问有两条链,麻烦了
要求:将相同
structure的归为一行,标明Start_Residue_ID和End_Residue_ID,结果放在文本B.txt中
文本A.txt:
Residue
Structure
1A
H
2A
H
3A
4A
5A
6A
S
1B
i
2B
i
3B
E
4B
E
5B
E
说明:
Residue:有数字和字母组成,字母A表示A链
Structure 共8种:H B E G I T S K(K表示空格)
文本B.txt(统计结果):
A链
Number Structure Start_Residue_ID End_Residue_ID
1 H 1A 2A
2 K 3A 5A
3 S 6A 6A
B链
Number Structure Start_Residue_ID End_Residue_ID
1 i 1B 2B
2 E 3B 5B
首先处理全部文本,然后正则[0-9]A和[0-9]B区分一下,最后分别编号
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 12:40
由 eexpress
模模糊糊的。大概这意思吧。
代码: 全选
2010-09-29 12:39:19 三 ~
● cat t.pl
#!/usr/bin/perl
$os="X"; $ot="X";
while (<STDIN>){
chomp;
($t,$s)=split "\ ", $_;
if($s!~/$os/){
print "$ot\n$s\ $t\ ";
}
$os=$s;$ot=$t;
}
2010-09-29 12:39:30 三 ~
● cat t
1A H
2A H
3A K
4A K
5A K
6A S
1B i
2B i
3B E
4B E
5B E
2010-09-29 12:39:32 三 ~
● cat t|perl t.pl
X
H 1A 2A
K 3A 5A
S 6A 6A
i 1B 2B
E 3B 5B
Re: 求助:shell脚本编程统计文本A.txt中的信息
发表于 : 2010-09-29 13:02
由 trigger
就知道ee会用perl
