Notepad ++ Regex Ajuda na limpeza de arquivos

1

Eu tenho um arquivo csv (o separador de coluna é "& lt ;; >", o delimitador de texto é o aspas duplas e o separador de linha "crlf") de mais de 18000 linhas.

No entanto, muitos dos dados contidos no separador de texto contêm "crlf", isso cria um problema ao tentar importar ou validar a estrutura do arquivo, bem como outra.

"2"<;>"1305767"<;>"MSCUFH613249 [CRLF] 199PACKAGES"<;>""<;>"Y"[CRLF]

Eu tentei as sugestões encontradas nos seguintes posts sem sucesso.

  1. Substituir charaters
  2. Substituir o retorno do carro

Eu consegui usar o Notepad ++ para remover o retorno de carro com as opções Find \ Replace with the Wrap Around e Extented On. No entanto, isso também substitui o delimitador de linha no final da linha.

Eu gostaria de substituir todos os "\ r \ n" ou CRLF em qualquer delimitador de texto ("") por um espaço em branco.

Obrigado

    
por Raymond 12.12.2013 / 14:40

2 respostas

3

Isso deve ajudar:

\n(?!")|\r(?!")|\r\n(?!")
    
por 12.12.2013 / 14:51
2

Você pode usar as seguintes pesquisas de regex e substituições:

  1. Pesquise e substitua [CRLF] em " ... " com um espaço em branco simples:

    Localizar: "([^"]*)\r\n([^"]*)"

    Substituir: "$1 $2"

  2. Se necessário, pesquise & substitua <;> por um separador apropriado, digamos, , :

    Localizar: <;>

    Substituir: ,


Exemplo:

Entrada:

"2"<;>"1305767"<;>"MSCUFH613249 
 199PACKAGES"<;>""<;>"Y"

Saída:

Após o passo 1:

"2"<;>"1305767"<;>"MSCUFH613249   199PACKAGES<;>""<;>"Y"

Após o passo 2:

"2","1305767","MSCUFH613249   199PACKAGES,"","Y"
    
por 12.12.2013 / 16:09