分页: 1 / 3

有没有在一个目录十几万个文件里面搜索所有相同的文件方法 (已找到很多解决方案)

发表于 : 2007-11-08 9:04
xiehuoli
有没有在一个目录,十几万个文件里面搜索所有相同的文件方法
并把它归类出来
尝试用find不行。
如果有软件也行,软件最好
懂的知会一声,谢谢。

发表于 : 2007-11-08 9:17
sqlfm
相同意思是什么?

如果是 txt html doc ... 之类,可以用PHP 写个小程式 (PDF/IMAGE的话, 没测试过)

发表于 : 2007-11-08 9:17
eexpress
照片?那gqview有多级别的比较照片的功能。
其他文件?那不知道了。
文本?你建立一个svn。。。。也不知道如何搞。

Re: 有没有在一个目录十几万个文件里面搜索所有相同的文件方法

发表于 : 2007-11-08 9:20
bones7456
xiehuoli 写了:有没有在一个目录,十几万个文件里面搜索所有相同的文件方法
并把它归类出来
尝试用find不行。
如果有软件也行,软件最好
懂的知会一声,谢谢。
相同的文件?不懂啊,是指里面的内容相同吗?是文本文件吗?估计写个 shell script 可以搞定的吧..

发表于 : 2007-11-08 9:28
ofewiofewo
一种方法:find + md5sum ,根据md5判断重复文件

发表于 : 2007-11-08 9:29
eexpress
这妹托疯了。巨大的索引。md5会想死的。随便几个电影目录,你就别做事了。

发表于 : 2007-11-08 9:35
ofewiofewo
十几万部电影 ? :lol:
lz那估计是服务器吧,使劲折腾

发表于 : 2007-11-08 9:54
yaoms
find /your/dir/ -type f -exec ls -l {} \; | awk '{print $5 "\t" $8}' | sort > list.txt

list.txt 中大小相同的在一起,然后再想办法用md5sum比较。。 :)

发表于 : 2007-11-08 9:54
ltkun
用hash呢

发表于 : 2007-11-08 10:57
xiehuoli
是内容和名字 都一样
不一定是文本文件,只要内容相同的,都要找出来

发表于 : 2007-11-08 11:01
yiding_he
同一目录下,内容一样的文件,有可能;但是名字一样的,可能吗?

发表于 : 2007-11-08 11:27
xiehuoli
yiding_he 写了:同一目录下,内容一样的文件,有可能;但是名字一样的,可能吗?
可能,因为还有子文件夹

发表于 : 2007-11-08 11:27
bones7456
xiehuoli 写了:是内容和名字 都一样
不一定是文本文件,只要内容相同的,都要找出来
你的意思是同个目录下有很多子目录,然后各子目录里面有同名的又同内容的文件,是吗?
写脚本吧~

问题是你找出来以后想怎么处理呢?

发表于 : 2007-11-08 11:29
leeaman
傻瓜建议:先找名字一样 大小一样的找出来再说,能满足这两个条件的恐怕都不是很多了,不过这个只能是用来找文件而已,如果要做什么自动处理的话,那还要把符合上面两个条件的文件在比较过才行

发表于 : 2007-11-08 11:38
xiehuoli
bones7456 写了:
xiehuoli 写了:是内容和名字 都一样
不一定是文本文件,只要内容相同的,都要找出来
你的意思是同个目录下有很多子目录,然后各子目录里面有同名的又同内容的文件,是吗?
写脚本吧~

问题是你找出来以后想怎么处理呢?
先找出来
等上头通知在处理