Ubuntu中文论坛

发表于： **2013-03-05 23:55**

由于研究的关系，经常需要下载一些专利文本。专利文本的一个特点经常是带压缩包的tiff文件，例如一个zip文件，里面有若干tif文件。虽然解压缩，制作pdf都是很容易的。但是一旦这类zip文件多了，一个个处理就很麻烦，于是想到用bash程序来解决。
本人是bash菜鸟，非常的菜，只能学习和理解一些基本的命令，因此写出来的很不好看，但是能用了，希望抛砖引玉。

假定：
下载了若干专利文件，皆为zip文件，下载时就已经用中文进行了命名，如“一种×××.zip”,现在要将每一个压缩包解压并生成单个的pdf文档。命令如下：

代码：全选

for file in `ls *.zip`; 		#得到各文件的文件名
do 
	echo ${file%.zip}; 	#得到的文件名去后缀
	dir=${file%.zip}; 	#将处理的文件名赋予变量dir
	mkdir $dir;			#建立以dir为文件名的目录
	cp -a $file $dir; 	#将目标文件（zip）拷贝到新建的文件夹
	cd $dir;			#进入该文件夹
	unzip -j *.zip; 		#解压目标文件（不包含目录）
	rm *.zip;			#删除zip文件
	tiffcp *.tif $dir.pdf;	#根据文件夹中的tiff文件生成pdf文档
	rm *.tif;			#删除tif文件
	mv *.pdf ..;		#将生成的pdf文件移动到文件夹外
	cd ..;			#回上一级目录
	rm -R $dir;			#删除以专利名称命名的文件夹
done;

如果你有更好的方法，请跟帖分享，

发表于： **2013-03-06 0:22**

for in *.zip就行了，不用ls

发表于： **2013-03-06 8:46**

曾在某专利文件里面，加了一段perl验证。导致此专利拖延了1年半。。

国内专利局的，估计以为是病毒。

发表于： **2013-03-06 10:19**

eexpress 写了：曾在某专利文件里面，加了一段perl验证。导致此专利拖延了1年半。。

国内专利局的，估计以为是病毒。

国内专利不一般是纸质申请材料么？

发表于： **2013-03-06 10:43**

perl又不是二进制。是文本啊。

发表于： **2013-03-06 11:34**

eexpress 写了：perl又不是二进制。是文本啊。

我以为你弄了个perl程序放在电子文档中呢。原来是写在纸上的程序，一般人都会觉得这程序很奇怪的。

发表于： **2013-04-01 10:56**

为什么目录建了删
删了建
在当前目录或者新建一个不就行了么？

Sent from my MI 1S using Tapatalk 2

发表于： **2013-04-01 11:43**

请教LZ, 申请专利的时候, 事先一定是要查是否有相同的吧. 但我发现类似的专利往往浩如烟海, 怎么查呀? 另外申请一个普通专利, 大致需要多少银子, 多长时间?

发表于： **2013-04-05 1:03**

唉，我真是闲的……

代码：全选

tmpdir=$(mktemp -d)
for onezip in *.zip
do
    unzip -j $onezip -d ${tmpdir}
    tiffcp ${tmpdir}/*.tif ./${onezip%.zip}.pdf
    rm ${tmpdir}/*.tif
done
rm -rf $tmpdir

发表于： **2013-04-05 23:34**

yjcong 写了：请教LZ, 申请专利的时候, 事先一定是要查是否有相同的吧. 但我发现类似的专利往往浩如烟海, 怎么查呀? 另外申请一个普通专利, 大致需要多少银子, 多长时间?

是的，需要查新否则已公布的任何结果都可能成为专利申请的障碍。
我一般是在http://www.cnipr.com/查，知识产权局和cnki也可以查，申请一个中国发明专利一般2000元以下，如果有附属物的话可能更多。专利从申请到授权约一年半到两年时间。

发表于： **2013-04-05 23:37**

needle 写了：唉，我真是闲的……

代码：全选

tmpdir=$(mktemp -d)
for onezip in *.zip
do
    unzip -j $onezip -d ${tmpdir}
    tiffcp ${tmpdir}/*.tif ./${onezip%.zip}.pdf
    rm ${tmpdir}/*.tif
done
rm -rf $tmpdir

Ubuntu中文论坛

菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本

Re: 菜鸟学习编写Bash程序不容易啊---一个用于自动处理专利文件的脚本