百科脚本

sh/bash/dash/ksh/zsh等Shell脚本
回复
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

百科脚本

#1

帖子 eexpress » 2009-04-27 9:07

代码: 全选

☎ cat baike.pl 
#!/usr/bin/perl
use LWP;
use LWP::UserAgent;
use Encode;
my $ua = LWP::UserAgent->new();
$ua->max_size( 35 * 1024 );
$in=`echo $ARGV[0]|iconv -f utf8 -t gbk|uni2ascii -a J`;
my $reply = $ua->get("http://baike.baidu.com/list-php/dispose/searchword.php?word=".$in."&pic=0");
my $html;
if($reply->is_success){
$html = $reply->content;
$html=~/URL=(.*)'/;
my $new=$1;
if($new!~/\d+\.htm/){print "没有收录。$new。";die;}
print "实际链接:http://baike.baidu.com".$new;
my $reply = $ua->get("http://baike.baidu.com".$new);
if($reply->is_success){
$html = $reply->content;
$html=~s/^.*?<\/h\d>//is;       # 开头到</h1>删除
$html=~s/<.*?>//gis;
$html=~s/\ *//gis;
#$html=~s/&.*?;//gis;
#s/&/&/g; s/&gt/>/g; s/</</g;
#s/"/"/g; s/&nbsp;/ /g;

$html=~s/\x0d\x0a/\n/gis;
$html=decode("GBK", $html);
$html=encode("UTF-8", $html);
$html=~s/百度百科.*//is;
$html=~s/\xe3\x80\x80//gim;
$html=~s/^[\x00-\x80]+$//gim;   # 全英文行
$html=~s/^$//gis;

if($ARGV[1]){
$html=~s/\x0a+/ ► /gis;
}
print $html;
}
}
else {die "无法获取的地址。";}
2009-04-27 08:50:44 一 ~
☎ baike.pl cam
实际链接:http://baike.baidu.com/view/4211.htm
CAM有六个常见解释:
1、CAM(computerAidedManufacturing,计算机辅助制造):利用计算机来进行生产设备管理控制和操作的过程。它输入信息是零件的工艺路线和工序内容,输出信息是刀具加工时的运动轨迹(刀位文件)和数控程序。
2、补充和另类医学,complementaryandalternativemedicine。
亦指内容可寻址存储器(ContentAddressableMemory)。
3、电影用于:CAM(枪版)
CAM通常是用数码摄像机从电影院盗录。即digitalcamera或camcorder的缩写,俗称枪版。有时会使用小三角架,但大多数时候不可能使用,所以摄像机会抖动。因此我们看到画面通常偏暗人物常常会失真,下方的字幕时常会出现倾斜。由于声音是从摄像机自带的话筒录制,所以经常会录到观众的笑声等声音。因为这些因素,图象和声音质量通常都很差。
4、细胞粘着分子(celladhesionmolecule,CAM)
参与细胞粘着的分子称为细胞粘着分子。
5.条件接收模块(ConditionalAccessModule),
常用与付费电视终端以及头端的解扰模块,属于卫星电视术语范畴。
6.景天科酸代谢
景天科酸代谢(crassulaceanacidmetabolism)
许多肉质植物的一种特殊代谢方式,简称CAM。它们的绿色组织上的气孔夜间开放,吸收并固定CO2,形成以苹果酸为主的有机
● 鸣学
头像
xiooli
帖子: 6956
注册时间: 2007-11-19 21:51
来自: 成都
联系:

Re: 百科脚本

#2

帖子 xiooli » 2009-04-27 9:17

居然用百度百科?
头像
lerosua
论坛版主
帖子: 8455
注册时间: 2007-11-29 9:41
联系:

Re: 百科脚本

#3

帖子 lerosua » 2009-04-27 9:20

ee又出手了
aBiNg
帖子: 1331
注册时间: 2006-07-09 12:22
来自: 南京

Re: 百科脚本

#4

帖子 aBiNg » 2009-04-27 9:24

xiooli 写了:居然用百度百科?
头像
sunningv
帖子: 1818
注册时间: 2006-12-17 13:34
来自: 武汉

Re: 百科脚本

#5

帖子 sunningv » 2009-04-27 9:27

:em03
人生长恨水长东;
远近高低各不同.
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

Re: 百科脚本

#6

帖子 eexpress » 2009-04-27 9:35

irc bot的,输出太长,不能用,才贴这里的。
不知道你们感慨什么,难道有更好的地方?
● 鸣学
头像
friend.ethan
帖子: 687
注册时间: 2008-05-13 20:40
来自: 江南西道

Re: 百科脚本

#7

帖子 friend.ethan » 2009-04-27 9:44

好东西,收藏了。
头像
greco
帖子: 2487
注册时间: 2007-04-06 10:24
来自: ~/Shanghai

Re: 百科脚本

#8

帖子 greco » 2009-04-27 10:48

没写过perl脚本
看了看,还算看的懂

原来perl还真蛮简洁的 :em03
http://silenceisdefeat.com/~greco

代码: 全选

''.join([chr(ord(c)-2) for c in 'O{"G/ockn"ku<"itgeq0ujkBiockn0eqo'])
echo -n "Z3JlY28uc2hpQGdtYWlsLmNvbQ==" | base64 -d
头像
yjcong
帖子: 2470
注册时间: 2006-02-28 3:11

Re: 百科脚本

#9

帖子 yjcong » 2009-04-28 11:19

eexpress 写了:irc bot的,输出太长,不能用,才贴这里的。
不知道你们感慨什么,难道有更好的地方?
http://en.wikipedia.org/wiki/Main_Page
一梦三年,
松风依旧,
萝月何曾老.


灵幽听微, 谁观玉颜?
灼灼春华, 绿叶含丹.
userzhiyuan
帖子: 42
注册时间: 2009-04-11 13:04

Re: 百科脚本

#10

帖子 userzhiyuan » 2009-04-30 21:40

刚刚加入论坛没多少天.就能感觉到ee肯定是个爱学.自学.有时间的家伙.你写的这个很不错哦.正想要这类的软件.感谢分享.
头像
yjcong
帖子: 2470
注册时间: 2006-02-28 3:11

Re: 百科脚本

#11

帖子 yjcong » 2009-04-30 21:44

userzhiyuan 写了:刚刚加入论坛没多少天.就能感觉到ee肯定是个爱学.自学.有时间的家伙.你写的这个很不错哦.正想要这类的软件.感谢分享.
人家阿姨是邪恶的资本家, 当然有大把的时间了
一梦三年,
松风依旧,
萝月何曾老.


灵幽听微, 谁观玉颜?
灼灼春华, 绿叶含丹.
回复