分页: 1 / 1

菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-03-05 23:55
shinery
由于研究的关系,经常需要下载一些专利文本。专利文本的一个特点经常是带压缩包的tiff文件,例如一个zip文件,里面有若干tif文件。虽然解压缩,制作pdf都是很容易的。但是一旦这类zip文件多了,一个个处理就很麻烦,于是想到用bash程序来解决。
本人是bash菜鸟,非常的菜,只能学习和理解一些基本的命令,因此写出来的很不好看,但是能用了,希望抛砖引玉。

假定:
下载了若干专利文件,皆为zip文件,下载时就已经用中文进行了命名,如“一种×××.zip”,现在要将每一个压缩包解压并生成单个的pdf文档。命令如下:

代码: 全选

for file in `ls *.zip`; 		#得到各文件的文件名
do 
	echo ${file%.zip}; 	#得到的文件名去后缀
	dir=${file%.zip}; 	#将处理的文件名赋予变量dir
	mkdir $dir;			#建立以dir为文件名的目录
	cp -a $file $dir; 	#将目标文件(zip)拷贝到新建的文件夹
	cd $dir;			#进入该文件夹
	unzip -j *.zip; 		#解压目标文件(不包含目录)
	rm *.zip;			#删除zip文件
	tiffcp *.tif $dir.pdf;	#根据文件夹中的tiff文件生成pdf文档
	rm *.tif;			#删除tif文件
	mv *.pdf ..;		#将生成的pdf文件移动到文件夹外
	cd ..;			#回上一级目录
	rm -R $dir;			#删除以专利名称命名的文件夹
done;

如果你有更好的方法,请跟帖分享, :em03

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-03-06 0:22
枫叶饭团
for in *.zip就行了,不用ls

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-03-06 8:46
eexpress
曾在某专利文件里面,加了一段perl验证。导致此专利拖延了1年半。。

国内专利局的,估计以为是病毒。 :em04

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-03-06 10:19
shinery
eexpress 写了:曾在某专利文件里面,加了一段perl验证。导致此专利拖延了1年半。。

国内专利局的,估计以为是病毒。 :em04
国内专利不一般是纸质申请材料么?

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-03-06 10:43
eexpress
perl又不是二进制。是文本啊。

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-03-06 11:34
shinery
eexpress 写了:perl又不是二进制。是文本啊。
我以为你弄了个perl程序放在电子文档中呢。原来是写在纸上的程序,一般人都会觉得这程序很奇怪的。 :em02

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-04-01 10:56
shuizhongyu
为什么目录建了删
删了建
在当前目录或者新建一个不就行了么?

Sent from my MI 1S using Tapatalk 2

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-04-01 11:43
yjcong
请教LZ, 申请专利的时候, 事先一定是要查是否有相同的吧. 但我发现类似的专利往往浩如烟海, 怎么查呀? 另外申请一个普通专利, 大致需要多少银子, 多长时间?

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-04-05 1:03
needle
唉,我真是闲的……

代码: 全选

tmpdir=$(mktemp -d)
for onezip in *.zip
do
    unzip -j $onezip -d ${tmpdir}
    tiffcp ${tmpdir}/*.tif ./${onezip%.zip}.pdf
    rm ${tmpdir}/*.tif
done
rm -rf $tmpdir

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-04-05 23:34
shinery
yjcong 写了:请教LZ, 申请专利的时候, 事先一定是要查是否有相同的吧. 但我发现类似的专利往往浩如烟海, 怎么查呀? 另外申请一个普通专利, 大致需要多少银子, 多长时间?
是的,需要查新否则已公布的任何结果都可能成为专利申请的障碍。
我一般是在http://www.cnipr.com/查,知识产权局和cnki也可以查,申请一个中国发明专利一般2000元以下,如果有附属物的话可能更多。专利从申请到授权约一年半到两年时间。

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

发表于 : 2013-04-05 23:37
shinery
needle 写了:唉,我真是闲的……

代码: 全选

tmpdir=$(mktemp -d)
for onezip in *.zip
do
    unzip -j $onezip -d ${tmpdir}
    tiffcp ${tmpdir}/*.tif ./${onezip%.zip}.pdf
    rm ${tmpdir}/*.tif
done
rm -rf $tmpdir
:em11