Importando dados do CSV com vírgulas aninhadas entre parênteses e colchetes nos campos

0

Problema

Estou tentando importar dados de um CSV para o Excel, mas os dados incluem vírgulas em campos individuais. As vírgulas que eu quero ignorar estão contidas entre parênteses e colchetes. Gostaria de encontrar uma maneira de importar esses dados corretamente, em vez de ter que editar e editar todos os "campos problemáticos" manualmente . Parte disso pode ser ainda mais complicada devido à codificação original do arquivo em japonês, que eu tenho que adaptar para visualizá-lo corretamente. Não tenho certeza se isso pode estar contribuindo para o problema, mas achei que seria importante mencionar.

Exemplos

A linha superior é copiada diretamente do arquivo inicial com problemas de codificação. A linha do meio é do arquivo txt fixo esperançosamente codificado corretamente. A linha inferior é do arquivo csv resultante.

"   2010009"    9623    ・・・・・・・P・・・ユ    ・E・'・m  ・・・t・s・ヤ・ゥ・・・・・F・゚・J・ャ147-1・シ   ・・・カ(・・・・   ・・・・    ・モ・・)   ・テ・・(・テ・ュ[・O・・  ・・・・    ・・・・])  ・W・・・ユ   ・テ・ュ    ・L・ヒ   ・ヘ・ン・i・u・・   ・・・n    ・・・シ・n・E・サ・フ・シ  ・R・ム    ・ィ・n   ・ュ・・(・テ・ュ[・・・ュ])    ・Z・・・E・・・ィ(・Z・・・ユ)  ・y・B    ・ヒ(・L・ヒ・E・L・w[・L・w])    ・Z・・・E・・・ィ(・・[・ラ・・<・ラ・オ・・>])・E・y・・・゙(・・・カ・y・・[・チ・]・・<B  E・V E・W>    ・タ・s<1  2   3a> ・W・R<2  3>  ・フ・シ・・  ・x・V・・<1    2>  ・O・Y]   ・y・t・・) ・y・サ・i(・y・・ ・L・E・~・ツ    ・y・ナ    ・ョ・ィ・'・y・サ・i    ・~・j・'・・・A・y・・) ・ホ・・(・・・ホ   ・ネ・ホ    ・・・ホ    ・ホ・_    ・ホ・・    ・ニ・リ・ホ) ・ホ・サ・i(・ホ・  ・ホ・M    ・ホ・V    ・ホ・サ・・・ナ)   ・エH1・'8、・カ199.205.218.230.237.258.269   H1・'8・N・イ・ク

    2010009,9623,内野第1遺跡,ウチノ,千葉市花見川区宇那谷町147-1他,縄文(中期,後期,晩期),古代(古墳[前期,中期,後期]),集落跡, 古墳, 貝塚,河岸段丘上, 低地, 低湿地・その他, 山林, 畑地,墳墓(古墳[方墳]),住居・建物(住居跡),土坑,塚(貝塚・貝層[貝層]),住居・建物(穴[陥穴<陥し穴>])・土器類(縄文土器[加曽利<B,EⅢ,EⅣ>,安行<1,2,3a>,姥山<2,3>,称名寺,堀之内<1,2>,前浦],土師器),土製品(土偶,有孔円板,土版,動物形土製品,ミニチュア土器),石器(磨石,敲石,凹石,石棒,石剣,独鈷石),石製品(石斧,石皿,石鏃,石製岩版),抄H1~8、文199.205.218.230.237.258.269,H1~8年調査

"   2010009"    9623    内野第1遺跡  ウチノ 千葉市花見川区宇那谷町147-1他   縄文(中期   後期  晩期) 古代(古墳[前期    中期  後期])    集落跡  古墳  貝塚 河岸段丘上    低地  低湿地・その他     山林  畑地 墳墓(古墳[方墳])  住居・建物(住居跡)  土坑  塚(貝塚・貝層[貝層])    住居・建物(穴[陥穴<陥し穴>])・土器類(縄文土器[加曽利<B    EⅢ  EⅣ> 安行<1    2   3a> 姥山<2    3>  称名寺 堀之内<1   2>  前浦] 土師器)    土製品(土偶  有孔円板    土版  動物形土製品  ミニチュア土器)    石器(磨石   敲石  凹石  石棒  石剣  独鈷石)    石製品(石斧  石皿  石鏃  石製岩版)   抄H1~8、文199.205.218.230.237.258.269  H1~8年調査

Relacionado

Eu encontrei esses tópicos relacionados que se relacionavam com o problema, eles ajudaram um pouco, mas realmente não resolveram o problema.

Como obtenho o Excel para importar um arquivo CSV com vírgulas em alguns dos campos de conteúdo?

Importando o CSV para o Excel com vírgulas nos campos entre aspas

Como definir a codificação de caracteres ao abrir o Excel

atualização

No post "Como obtenho o Excel para importar um arquivo CSV com vírgulas em alguns dos campos de conteúdo?" a questão era devido a espaços entre as vírgulas entre campos e as seguintes aspas e valores. Nesse caso, espaços não são o problema, mas sim que as vírgulas são aninhadas entre parênteses e colchetes. Existe uma maneira de segmentar especificamente apenas as vírgulas que estão presentes entre parênteses e colchetes?

    
por Corey 29.09.2018 / 07:06

0 respostas