awk mesclando linhas por sequência de vários arquivos em um arquivo

2

Eu tenho muitos arquivos e preciso mesclar strings entre eles por grupos de três arquivos. Cada arquivo tem ~ 100-500 linhas e o arquivo resultante é ~ 100-200Mb.

O gerador de palavras-chave ppc faz a mesma coisa, mas é muito lento; depois de 1 milhão de palavras-chave, leva de 2 a 3 horas para um arquivo de resultado.

f1

Acapella Audio Arts
Acoustic Smart

f2

australian
Australia
America

f3

Round Grille
Square Grille
grille
defence grille

resultado

Acapella Audio Arts australian Round Grille
Acapella Audio Arts australian Square Grille
Acapella Audio Arts australian grille
Acapella Audio Arts australian defence grille
Acapella Audio Arts Australia Round Grille
Acapella Audio Arts Australia Square Grille
Acapella Audio Arts Australia grille
Acapella Audio Arts Australia defence grille
Acapella Audio Arts America Round Grille
Acapella Audio Arts America Square Grille
Acapella Audio Arts America grille
Acapella Audio Arts America defence grille
Acoustic Smart australian Round Grille
Acoustic Smart australian Square Grille
Acoustic Smart australianе grille
Acoustic Smart australian defence grille
Acoustic Smart Australia Round Grille
Acoustic Smart Australia Square Grille
Acoustic Smart Australia grille
Acoustic Smart Australia defence grille
Acoustic Smart America Round Grille
Acoustic Smart America Square Grille
Acoustic Smart America grille
Acoustic Smart America defence grille 
etc.....
    
por Michael Z 04.11.2015 / 16:53

1 resposta

3

Apenas com o bash:

while IFS= read -u3 -r product; do
    while IFS= read -u4 -r region; do
        while IFS= read -u5 -r option; do
            echo "$product $region $option"
        done 5<f3
    done 4<f2
done 3<f1

Esta versão terá menos i / o de arquivo (leia cada arquivo apenas uma vez) para que seja mais rápido

mapfile -t products < f1
mapfile -t regions  < f2
mapfile -t options  < f3
for product in "${products[@]}"; do 
    for region in "${regions[@]}"; do
        for option in "${options[@]}"; do
            echo "$product $region $option"
        done
    done
done
    
por 04.11.2015 / 17:14

Tags