电脑长时间使用之后,不可避免的会产生各种无用的文件,而这其中有很大一部分都是重复文件,这些重复文件可能是你出于临时备份多次复制而产生的,也有可能是某些软件程序自动生成的,本篇文章为大家介绍一下Linux下寻找相同的文件具体方法。
所以如果你的电脑空间告急的话,可以试着去删除这样的文件,释放一些空间。在 Linux 下,我们可以通过识别文件的 inode 值来找出系统中的相同文件。
inode 是一个数据结构,记录了文件所有信息,除了文件名和文件内容。如果两个或多个文件具有相同的 inode 值,即使它们的文件名不一样,位置不一样,它们的内容、所有者、权限其实都是一样的,我们可以将其视有相同文件。
这类型的文件其实就是所谓的「硬链接」。硬链接具有相同的 inode 值,但文件名不一样。而软链接其实就是快捷方式,它指向目标文件,但有着自己的 inode 值。
$ ls -l my* -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 myfile lrwxrwxrwx 1 liangxu liangxu 6 Apr 15 11:18 myref -> myfile -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 mytwin
我们无法直接知道同一目录下有哪些文件是有相同的 inode 值,但要识别起来也不难。其实我们只要使用 ls -i 命令,再以 inode 值进行排序,就可以直接找到这些文件。
$ ls -i | sort -n | more ... 788000 myfile
在这个结果的第一列里,就是对应的 inode 值。所以从这个结果里我们一眼就可以看出来,哪些文件具有相同 inode 值。
如果你只是想找到一个文件的对应硬链接文件,我们可以使用 find 命令,再加个 -samefile 选项即可快速找到。
$ find . -samefile myfile ./myfile ./save/mycopy ./mytwin
这些文件都是有相同的 inode 值,不信的话可以再使用 ls 命令来查看更多信息:
$ find . -samefile myfile -ls 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./myfile 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./save/mycopy 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 ./mytwin
我们可以看到,除了文件名之外,这几个文件名的信息完全一样。细心的朋友可能会注意到,在第2列(硬连接数)是4,而实际上我们找出来的文件只有3个,这说明还有一个文件与他们共享 inode 值,只是我们通过这条命令没有找出来而已。
作为一个懒人,每次敲命令多麻烦,直接上脚本找出目录下的相同文件!
#!/bin/bash # seaches for files sharing inodes prev="" # list files by inode ls -i | sort -n > /tmp/$0 # search through file for duplicate inode #s while read line do inode=`echo $line | awk '{print $1}'` if [ "$inode" == "$prev" ]; then grep $inode /tmp/$0 fi prev=$inode done $0 # clean up rm /tmp/$0
运行结果:
$ ./findHardLinks 788000 myfile 788000 mytwin
当然了,你还可以使用 find 命令,根据 inode 值,找到系统里所有相同文件。
$ find / -inum 788000 -ls 2> /dev/null 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /tmp/mycopy 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/myfile 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/save/mycopy 788000 4 -rw-r--r-- 4 liangxu liangxu 228 Apr 12 19:37 /home/liangxu/mytwin
在这条命令里,我们将错误提示重定向到 /dev/null 这个特殊文件里,这样在搜索一些我们没有权限访问的路径时,不会满屏的 permission denied 。
本文来源:www.lxlinux.net/4063.html,若引用不当,请联系修改。