A maneira mais eficiente de obter um subconjunto de linhas

Question

#1 resposta do (5 votos)

5

Eu tenho dois arquivos. Uma enorme (200.000 linhas) chamada 'db' e uma grande (15.000 + linhas) chamada 'índices'.

Qual é a maneira mais rápida de filtrar as linhas em 'db' contendo qualquer índice (em qualquer lugar da linha) de 'índices'

A solução que consegui pensar é

for index in $(cat indices); do
  grep $index db >> selection
done;

mas isso está demorando muito tempo.

Existe uma abordagem mais rápida no bash, linux?

bash linux

por Peter Smit 09.02.2010 / 08:43

1 resposta

score 5 · Accepted Answer

fgrep -f indices db

deve ser mais rápido.