批量检测发票真伪,求编写方向。

sh/bash/dash/ksh/zsh等Shell脚本
回复
formylove2
帖子: 105
注册时间: 2008-11-03 10:06

批量检测发票真伪,求编写方向。

#1

帖子 formylove2 » 2010-07-20 11:24

http://swcx.hb-n-tax.gov.cn/hbgs1/invoice/
这个是湖北省的交互性查询发票真伪的地址


我想的是 首先按规定格式将需要查询的号码都输入进去
然后跑个脚本批量读出这些号码 与这个网址进行交互 然后对结果进行分析 得到 真伪验证


求这些过程需要哪些东东?
pope123
帖子: 34
注册时间: 2008-09-21 1:01

Re: 批量检测发票真伪,求编写方向。

#2

帖子 pope123 » 2010-07-30 16:37

主要是验证码这里比较麻烦。
头像
xiooli
帖子: 6956
注册时间: 2007-11-19 21:51
来自: 成都
联系:

Re: 批量检测发票真伪,求编写方向。

#3

帖子 xiooli » 2010-07-30 17:04

代码: 全选

#!/bin/bash
#发票代码
fp_code=?
#发票号
fp_number=?

url="http://swcx.hb-n-tax.gov.cn/hbgs1/invoice/front/invoice_opr.jsp"
vercode_url="http://swcx.hb-n-tax.gov.cn/hbgs1/invoice/front/invoice_random.jsp"
cd /tmp
curl "$vercode_url" -o yzm.jpg
convert yzm.jpg ppm:- | ppm2tiff yzm.tif
tesseract yzm.tif out

yzm="`cat out.txt`"
if [ "$yzm" ]; then
    curl -d "$url?fp_code=${fp_code}&fp_number=${fp_number}&verify_code=${yzm}"
else
    echo "验证码未能识别"
fi
注:没有用发票验证过,不过理论上说应该是这样的。lz你可以试试然后反馈一下。还有验证码识别不一定100%准确,不过它那个网站的验证码非常简单,我试过一个,识别是正确的。
pope123
帖子: 34
注册时间: 2008-09-21 1:01

Re: 批量检测发票真伪,求编写方向。

#4

帖子 pope123 » 2010-08-02 17:53

大牛啊
pope123
帖子: 34
注册时间: 2008-09-21 1:01

Re: 批量检测发票真伪,求编写方向。

#5

帖子 pope123 » 2010-08-02 18:00

不过发现还要加个cookies,
下验证码的时候保存下
curl "$vercode_url" -o yzm.jpg -D cookies.txt
发送验证的时候加上cookies
curl -b cookies.txt "$url?fp_code=${fp_code}&fp_number=${fp_number}&verify_code=${yzm}"

而且貌似还可以就用一个验证码,然后不停的发送验证请求哎。
formylove2
帖子: 105
注册时间: 2008-11-03 10:06

Re: 批量检测发票真伪,求编写方向。

#6

帖子 formylove2 » 2010-08-12 15:13

恩!非常感谢楼上的几位大虾的热心帮助!最近太忙,才发现发现这个帖子有人回了,我试试!

再次感谢!!
回复