#fdupes es la herramienta para buscar ficheros duplicados. Con la sencilla sentencia, mostrará todos los ficheros duplicados:
fdupes directorio -r
Si buscamos imágenes duplicadas podemos usar imgdupes, un clon del fdupes especializado en imágenes. Este clon sólo mostrará ficheros JPEG, y que sólo compara el nombre del archivo, sin tener en cuenta los metadatos, como tags EXIF (y XMP e IPTC) . Con fdupes podremos saber cual es la imagen “buena” (por sus tags, geolocalizada y rotada), o cuál es simplemente una copia de la imagen original que se ha re-importado por error, y que podemos borrar tranquilamente.
El funcionamiento es similar a fdupes: ejecutarlo en una directorio, y a partir de ahí busca y muestra los duplicados. Entonces qué diferencias hay:
- Funciona por defecto en modo recursivo por lo que nos ahorramos poner “-r”.
- imgdupes genera una caché con los hashes de las imágenes. Es un ficherito oculto que en una carpeta con muchas fotos, puede suponer la diferencia entre tardar 30 segundos, o tardar 12 horas. Si no queremos usar caché basta con añadir «-c».
- El modo interactivo no sólo permite escoger un fichero y borrar el resto. Hay unas cuantas opciones adicionales:
- detail: Muestra la diferencia de metadatos de las imágenes duplicadas.
- show: Esta opción se copiarán los ficheros duplicados a una carpeta temporal, y se abrirá un explorador de ficheros, de forma que el usuario lo pueda analizar con calma. Hay que tener en cuenta que esto son copias, por lo que borrarlas o no no afecta en nada al proceso.