Melhor maneira de procurar por uma string (texto) em 10 arquivos CSV grandes (250MB cada)

2

Eu estou querendo saber qual é a melhor maneira ou ferramenta para procurar por um texto específico ou string em mais de 10 grandes arquivos .csv. Cada arquivo tem 250MB de tamanho.

Minha idéia era escrever um script PowerShell, já que eu amo coisas feitas por mim, por outro lado, talvez já exista uma ferramenta perfeita e eu só desperdiço meu tempo:)

    
por RayofCommand 28.08.2014 / 09:48

2 respostas

4

Você pode experimentar uma versão do Grep :

Grep is a command-line utility for searching plain-text data sets for lines matching a regular expression.

Esta resposta por JdeBP lista uma série de versões do Grep para Windows.

Eu gosto e uso o conjunto de ferramentas cygwin ...

    
por 28.08.2014 / 10:18
2

O PowerShell tem Select-String que pesquisará em arquivos de texto por uma expressão regular:

Get-Item path\to\*.csv | Select-String -Pattern <string>

Você pode usar a opção -SimpleMatch para pesquisar uma string literal. Todas as linhas que correspondem ao seu padrão de pesquisa são mostradas.

Se você deseja fazer uma filtragem mais avançada, também pode usar Import-Csv para converter um arquivo CSV em objetos, com propriedades para cada coluna.

    
por 28.08.2014 / 16:45