Script para encontrar o tamanho dos arquivos de imagem

0

Eu tenho arquivos de imagem espalhados por todo o meu computador, então eu gostaria de escrever um script que receba como entrada um caminho completo para um diretório, exiba o tamanho total dos arquivos de imagem (.jpg, .jpeg) em cada dos subdiretórios e somar todos os tamanhos reunidos e exibir a soma também. Alguma idéia?

    
por user43389 17.01.2015 / 10:23

2 respostas

1

O seguinte não é perfeito. Ele não manipula diretórios com espaços, mas a menos que você tenha uma carga de diretórios de cabeçalho com sufixos idênticos, isso não é realmente um problema.

find -type f -iname '*.jpg' -o -iname '*.jpeg' -o -iname '*.png' -o -iname '*.gif' -printf '%h %s\n' \
| awk -F '[ /]' '{a[$2] += $NF} END{for(i in a){print i, a[i]}}'
    
por Oli 17.01.2015 / 10:47
1

Definitivamente mais detalhada, uma opção de python:

#!/usr/bin/env python3
import subprocess
import os
#---------------------------
directory = '/path/to/images'
m_subject = 'image'
#---------------------------
def get(command):
    return subprocess.check_output(["/bin/bash", "-c", command]).decode("utf-8")

total_size = []
for root, dirs, files in os.walk(directory):
    for file in files:
        file = '"'+root+'/'+file+'"' 
        mtype = get('file --mime-type '+file).strip().split(' ')[-1]
        if m_subject in mtype:
            size = get("du -hk "+file).split()[0]; total_size.append(int(size))
            print(file.strip('"')+"\n", mtype+"\n", size+" k\n")
print("-"*30, "\nnumber of files: "+str(len(total_size)), "\ntotal size: "+str(sum(total_size))+" k")
try:
    print("average size: "+str(int(sum(total_size)/len(total_size)))+" k")
except ZeroDivisionError:
    pass

Lista todos os arquivos de imagem recursivamente dentro de directory , fornece o tamanho por arquivo e o tamanho total no final:

..................

/path/to/image3828.JPG
 image/jpeg
 1024 k

/path/to/image3829.JPG
 image/jpeg
 1024 k

/path/to/image3830.JPG
 image/jpeg
 1024 k

------------------------------
number of files: 3830
total size: 4248576 k
average size: 1109 k

Como usar:

  • Copie o script em um arquivo vazio
  • Na seção head do script, defina o tipo ( m_subject = ) e o diretório ( directory = ) que você gostaria de pesquisar.
  • Salvar como list_image.py
  • Execute-o pelo comando:

    python3 /path/to/list_image.py
    

Refinando os resultados

Você pode limitar ainda mais os resultados encontrados alterando o valor m_subject = para image/jpeg ou image/png , por exemplo.

Editar: opções de classificação

Você não pediu, mas agora temos o script, seria uma pena não adicionar mais algumas opções (de classificação) para obter uma visão melhor sobre a ocorrência de imagens dentro de seu diretório.

A versão abaixo adiciona a opção de ordenar por "tamanho", "nome", "diretório" ou "tipo" . Ordenado por "tamanho", dando uma saída como:

.........

image_09.jpg            image/jpeg  956 k   /path/to/image_1.jpg
image_10.jpg            image/jpeg  1044 k  /path/to/image_2.jpg
image_11.jpg            image/jpeg  1072 k  /path/to/image_3.jpg
image_12.jpg            image/jpeg  1108 k  /path/to/image_4.jpg
image_13.jpg            image/jpeg  1180 k  /path/to/image_5.jpg
image_14.jpg            image/jpeg  1720 k  /path/to/image_6.jpg
image_15.jpg            image/jpeg  1832 k  /path/to/image_7.jpg
------------------------------ 
number of files: 15 
total size: 13160 k
average size: 877 k

O script

  • Use como explicado para a primeira opção.
#!/usr/bin/env python3
import subprocess
import os
#---------------------------
directory = '/path/to/images'
m_subject = 'image'
sort = "size" # options are: "size", "name", "directory", "type"
#---------------------------
def get(command):
    return subprocess.check_output(["/bin/bash", "-c", command]).decode("utf-8")

total_size = []
images = []
# gathering information on the images
for root, dirs, files in os.walk(directory):
    for file in files:
        file_dr = '"'+root+'/'+file+'"' 
        mtype = get('file --mime-type '+file_dr).strip().split(' ')[-1]
        if m_subject in mtype:
            size = get("du -hk "+file_dr).split()[0]; total_size.append(int(size))
            images.append([file, mtype, int(size), file_dr.replace('"', "")])
# sorting options
if sort == "name":
    images.sort(key=lambda x: x[0])
elif sort == "type":
    images.sort(key=lambda x: x[1])
elif sort == "size":
    images.sort(key=lambda x: x[2])
elif sort == "directory":
    images.sort(key=lambda x: x[3])
for image in images:
    image[2] = str(image[2])+" k"
# print info per image
    print(("\t").join(image))
#print summary
print("-"*30, "\nnumber of files: "+str(len(total_size)), "\ntotal size: "+str(sum(total_size))+" k")
try:
    print("average size: "+str(int(sum(total_size)/len(total_size)))+" k")
except ZeroDivisionError:
    pass
    
por Jacob Vlijm 17.01.2015 / 11:20