A maneira mais eficiente de obter um subconjunto de linhas

5

Eu tenho dois arquivos. Uma enorme (200.000 linhas) chamada 'db' e uma grande (15.000 + linhas) chamada 'índices'.

Qual é a maneira mais rápida de filtrar as linhas em 'db' contendo qualquer índice (em qualquer lugar da linha) de 'índices'

A solução que consegui pensar é

for index in $(cat indices); do
  grep $index db >> selection
done;

mas isso está demorando muito tempo.

Existe uma abordagem mais rápida no bash, linux?

    
por Peter Smit 09.02.2010 / 09:43

1 resposta

5
fgrep -f indices db 

deve ser mais rápido.

    
por 09.02.2010 / 10:29

Tags