分页: 1 / 1

破解 http://www.programfan.com/ 验证码

发表于 : 2010-07-05 3:06
神vlinux飘飘
纯蛋疼,不过现在programfan貌似早已堕落,好多杂草一样的广告遍布论坛,也没什么去暴菊的价值了。
以前是用Java做的识别验证码,现在改用shell,算法都一样--这个验证码的破解称做算法是有点抬举自己了--不过解析BMP文件为01点阵那句脚本我倒是自己优化了一个通宵,自我感觉算是亮点吧~

代码: 全选

cat $@ | od -j +0x36 -tx1 -vx | awk 'BEGIN{ORS=""}{if(NR%2!=0){print $2$3$4$5$6$7$8$9$10$11$12$13$14$15$16$17; if((NR+1)%24==0){print "\n"}}}' | sed '1!G;h;$!d' | sed s/000000/1/g | sed s/ffffff/0/g
自认为的亮点-_-

噢对了,虽然说Java性能不够C,但是SHELL如果用不好,性能更烂。所以这里的识别算法用纯脚本实现,之前识别一张验证码需要10秒,优化之后只需要0.32秒,感慨一下吧。

对了,大家不要拿来给这个网站做灌水机哈,这样做是不道德的,我会在道德层面上谴责你 :em02

例子
#下载验证码图片,保存为code.bmp
curl http://www.programfan.com/common/code.asp -s -o code.bmp
#进行解析
cat code.bmp | sh programfan_code.sh

Re: 破解 http://www.programfan.com/ 验证码

发表于 : 2010-07-06 16:18
ubuntu1023
lz的签名。。。 :em04

Re: 破解 http://www.programfan.com/ 验证码

发表于 : 2010-07-06 16:21
tenzu
我想要本论坛的灌水机

Re: 破解 http://www.programfan.com/ 验证码

发表于 : 2010-07-06 16:23
eexpress
支持lz继续。使用爬虫专业工具。 www:mechainize。更加智能。

Re: 破解 http://www.programfan.com/ 验证码

发表于 : 2010-07-06 17:13
delectate
识别验证码这个,感觉靠像素有点落后

怎么说呢,靠像素这个,只能是初级没有干扰的,用个动态+干扰,就失败了

最bt的也是最常用的莫过于google和facebook的验证码

Re: 破解 http://www.programfan.com/ 验证码

发表于 : 2010-07-07 0:41
神vlinux飘飘
这个识别算法是07年学习Java时候练手写的了,所以我将脚本的重点放在用SHELL解析BMP上。
到后边我的识别算法都是取图像特征点来进行匹配的,一般只要去噪、腐蚀、取特征点。纠偏都可以省了。

Re: 破解 http://www.programfan.com/ 验证码

发表于 : 2010-07-11 2:45
yjcong
字母, 字母, LZ把对字母的识别也加上啊

PS:对于那些不能复制的JAVA程序上的规则的数字和字母有没有什么可识别的办法啊?