Extrai o intervalo de elementos do elemento i para o j-ésimo, até o n-ésimo elemento de uma lista

0

Em um diretório eu tenho um certo número de arquivos. Isso poderia ser 53 arquivos txt, mas eu também poderia ter 123 arquivos. Os arquivos têm vários nomes aleatórios, mas todos possuem o identificador de arquivo .txt

Eu posso obter uma lista de todos os arquivos com ls e colocar isso em uma variável.

list_of_txt_files=$(ls *.txt)

Mas eu gostaria de particionar a lista em várias listas individuais, cada lista com apenas 10 elementos - ou seja, uma pasta com 53 arquivos txt, deve me dar 6 listas. São 5 listas com 10 nomes de arquivos e uma 6ª lista com 3 nomes de arquivos, e meu exemplo com 123 arquivos txt em um diretório deve fornecer 12 listas com 10 nomes de arquivos e uma 13ª lista com apenas 3 nomes de arquivos .

Com meu exemplo com 53 arquivos txt: não. 1 manteria o primeiro arquivo até o décimo arquivo e a lista não. 2 manteria o décimo primeiro arquivo até o vigésimo arquivo, e assim por diante. Eu intitulei minha pergunta do i-ésimo elemento j em uma lista, como suponho que outras pessoas podem querer dividir uma lista de forma diferente. Talvez desde o primeiro arquivo até o 100º arquivo em um diretório.

O objetivo final é poder usar essas listas em um loop for, e usar o comando cat, para escrever o conteúdo de dez arquivos por lista em um arquivo por conjunto de dez arquivos - ou seja, no meu exemplo com 53 arquivos em um diretório, isso me daria 6 arquivos. Onde os primeiros 5 arquivos contiverem o conteúdo dos 50 arquivos txt originais, e o 6º arquivo contiver o conteúdo dos últimos 3 arquivos txt restantes.

Eu considerei usar o comando head ou tail, mas não consegui descobrir como especificar intervalos para esses dois comandos.

    
por sku2003 02.06.2017 / 10:20

2 respostas

1

Em um shell com arrays , use-os. Diga com Bash:

$ touch {01..53}
$ files=(*)
$ echo "${files[@]:0:10}"       
01 02 03 04 05 06 07 08 09 10

$ for ((i = 0 ; i < ${#files[@]} ; i += 10 )) ; do
     echo "${files[@]:i:10}" ; 
     # or
     # cat "${files[@]:i:10}" > set-$(( i / 10 ))
  done
01 02 03 04 05 06 07 08 09 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
41 42 43 44 45 46 47 48 49 50
51 52 53

A expansão de substring (fatia da matriz) "${files[@]:i:10}" expande para uma lista de palavras, não uma única string, então você pode passar por cima dela:

for f in "${files[@]:i:10}" ; do
    somecmd "$f"
done

Não faça fazer files=$(ls *.txt) , o ls é completamente redundante lá, é o shell que avalia o curinga de qualquer maneira. Normalmente, você salva apenas o padrão curinga em uma variável ( pat=*.txt ) e usa-o (sem aspas), quando necessário, ou, se desejar expandi-lo para os nomes de arquivos reais, use echo *.txt em vez de ls . Para lidar com listas de nomes de arquivos, os arrays são melhores, se você não estiver limitado a um shell POSIX simples.

Quanto a dividir uma lista com head e tail , você precisará fazer algo como | head -20 | tail -10 para obter as linhas 11 a 20. Ou usar sed: | sed -n 11,20p .

    
por 02.06.2017 / 11:06
1

Com qualquer shell parecido com o Bourne (mas o shell Bourne que não pôde acessar elementos posicionais acima de $9 ), você pode fazer:

set -- *.txt
while [ "$#" -gt 0 ]; do
  something with "$1" ${2+"$2"} ${3+"$3"}... ${10+"${10}"}
  [ "$#" -gt 10 ] || break
  shift 10
done

Com GNU xargs e shells com suporte para substituição de processo:

xargs -n10 -r0a <(printf '%s
files=(*.txt(N))
while (($#files)) {
  something with $files[1,10]
  files[1,10]=()
}
' *.txt) something with

com zsh :

autoload -U zargs
xargs -l10 -- *.txt -- something with

Ou:

something with *.txt([1,10])

Observe também que você pode usar um intervalo em globs de zsh :

set -- *.txt
while [ "$#" -gt 0 ]; do
  something with "$1" ${2+"$2"} ${3+"$3"}... ${10+"${10}"}
  [ "$#" -gt 10 ] || break
  shift 10
done
    
por 02.06.2017 / 12:38