Processar arquivo de texto - Extrair dados que começam com número

1

Eu tenho uma lista de informações de contato que preciso processar no formato .txt , separado por , . Nós só queremos manter os códigos SIC que começam com 65 , que é imobiliário.

O comando deve verificar apenas o campo correto para os dados que começam com 65.

Por favor, tenha em mente que o número não será sempre 6531 , só tem que começar com 65 (6521 6555 6587 por exemplo seria algo que também gostaríamos de manter)

2,J,John Foraste Photography,[email protected],68 Middle Hwy,Barrington,RI,2806, , ,733511,Photographic Engineering,atlanticinn.com
3,X,Xerox Corp,[email protected],10 Orms St # 420,Providence,RI,02904-7815,5594547871,4012763242,504403,Copying & Duplicating Machines & Supls,www.xerox.com
4,S,St Sahag & St Mesrob Armenian,[email protected],70 Jefferson St,Providence,RI,02908-4923,4012722832,4012727712,866107,Churches,www.stsahmes.org
13,C,Century 21 Access America,[email protected],1025 Tiogue Ave,Coventry,RI,02816-6100,4018282100, ,6531,Real Estate, 
14,B,Baxter's Showroom,[email protected],Null,Warwick,RI,0,4017398222,4017397058,594409,Jewelers,baxtersjewelry.com^^majorfindings.com^^robertbaxter.com^^san
17,R,Re/Max South County,[email protected],56 Wells Street,Westerly,RI,2891,4015962067, ,6531,Real Estate, 
19,L,Lyn Reale - Block Island Realty,[email protected],215Chapelstreet,Block Island,RI,2807,4012534311, ,653118,Real Estate,stmichaelsbristolri.org
21,R,Re/Max South County,[email protected],56 Wells Street,Westerly,RI,2891,4015962067, ,6531,Real Estate, 
22,V,Vns Home Health Svc,[email protected],14 Woodruff Ave # 7,Narragansett,RI,02882-3467,4017882253,4017820500,808201,Home Health Service,

Após o processamento, a lista deve ser

13,C,Century 21 Access America,[email protected],1025 Tiogue Ave,Coventry,RI,02816-6100,4018282100, ,6531,Real Estate, 
17,R,Re/Max South County,[email protected],56 Wells Street,Westerly,RI,2891,4015962067, ,6531,Real Estate, 
19,L,Lyn Reale - Block Island Realty,[email protected],215Chapelstreet,Block Island,RI,2807,4012534311, ,653118,Real Estate,stmichaelsbristolri.org
21,R,Re/Max South County,[email protected],56 Wells Street,Westerly,RI,2891,4015962067, ,6531,Real Estate, 
    
por Teddy291 17.08.2015 / 14:26

3 respostas

2

com awk

awk -F, '{if ( $11 ~ /^65/ ) print $0}' file

explicação: use vírgula como separador de campos -F, , verifique se a coluna 11 começa ( ^ ) com 65 if ( $11 ~ /^65/ ) , se assim for imprima linha inteira print $0

    
por 17.08.2015 / 14:41
1

Isso deve ser feito:

#!/usr/bin/env perl

use strict;
use warnings;

while ( <> ) {
    print if (split /,/)[10] =~ m/^65/;
}

Pode um forro, se você gosta como:

perl -ne 'print if (split /,/)[10] =~ m/^65/;' yourfile
    
por 17.08.2015 / 14:33
0
sed '/,65[0-9]*,Real Estate/! d' file.txt
    
por 17.08.2015 / 15:25