Problema
Estou tentando importar dados de um CSV para o Excel, mas os dados incluem vírgulas em campos individuais. As vírgulas que eu quero ignorar estão contidas entre parênteses e colchetes. Gostaria de encontrar uma maneira de importar esses dados corretamente, em vez de ter que editar e editar todos os "campos problemáticos" manualmente . Parte disso pode ser ainda mais complicada devido à codificação original do arquivo em japonês, que eu tenho que adaptar para visualizá-lo corretamente. Não tenho certeza se isso pode estar contribuindo para o problema, mas achei que seria importante mencionar.
Exemplos
A linha superior é copiada diretamente do arquivo inicial com problemas de codificação. A linha do meio é do arquivo txt fixo esperançosamente codificado corretamente. A linha inferior é do arquivo csv resultante.
" 2010009" 9623 ・・・・・・・P・・・ユ ・E・'・m ・・・t・s・ヤ・ゥ・・・・・F・゚・J・ャ147-1・シ ・・・カ(・・・・ ・・・・ ・モ・・) ・テ・・(・テ・ュ[・O・・ ・・・・ ・・・・]) ・W・・・ユ ・テ・ュ ・L・ヒ ・ヘ・ン・i・u・・ ・・・n ・・・シ・n・E・サ・フ・シ ・R・ム ・ィ・n ・ュ・・(・テ・ュ[・・・ュ]) ・Z・・・E・・・ィ(・Z・・・ユ) ・y・B ・ヒ(・L・ヒ・E・L・w[・L・w]) ・Z・・・E・・・ィ(・・[・ラ・・<・ラ・オ・・>])・E・y・・・゙(・・・カ・y・・[・チ・]・・<B E・V E・W> ・タ・s<1 2 3a> ・W・R<2 3> ・フ・シ・・ ・x・V・・<1 2> ・O・Y] ・y・t・・) ・y・サ・i(・y・・ ・L・E・~・ツ ・y・ナ ・ョ・ィ・'・y・サ・i ・~・j・'・・・A・y・・) ・ホ・・(・・・ホ ・ネ・ホ ・・・ホ ・ホ・_ ・ホ・・ ・ニ・リ・ホ) ・ホ・サ・i(・ホ・ ・ホ・M ・ホ・V ・ホ・サ・・・ナ) ・エH1・'8、・カ199.205.218.230.237.258.269 H1・'8・N・イ・ク
2010009,9623,内野第1遺跡,ウチノ,千葉市花見川区宇那谷町147-1他,縄文(中期,後期,晩期),古代(古墳[前期,中期,後期]),集落跡, 古墳, 貝塚,河岸段丘上, 低地, 低湿地・その他, 山林, 畑地,墳墓(古墳[方墳]),住居・建物(住居跡),土坑,塚(貝塚・貝層[貝層]),住居・建物(穴[陥穴<陥し穴>])・土器類(縄文土器[加曽利<B,EⅢ,EⅣ>,安行<1,2,3a>,姥山<2,3>,称名寺,堀之内<1,2>,前浦],土師器),土製品(土偶,有孔円板,土版,動物形土製品,ミニチュア土器),石器(磨石,敲石,凹石,石棒,石剣,独鈷石),石製品(石斧,石皿,石鏃,石製岩版),抄H1~8、文199.205.218.230.237.258.269,H1~8年調査
" 2010009" 9623 内野第1遺跡 ウチノ 千葉市花見川区宇那谷町147-1他 縄文(中期 後期 晩期) 古代(古墳[前期 中期 後期]) 集落跡 古墳 貝塚 河岸段丘上 低地 低湿地・その他 山林 畑地 墳墓(古墳[方墳]) 住居・建物(住居跡) 土坑 塚(貝塚・貝層[貝層]) 住居・建物(穴[陥穴<陥し穴>])・土器類(縄文土器[加曽利<B EⅢ EⅣ> 安行<1 2 3a> 姥山<2 3> 称名寺 堀之内<1 2> 前浦] 土師器) 土製品(土偶 有孔円板 土版 動物形土製品 ミニチュア土器) 石器(磨石 敲石 凹石 石棒 石剣 独鈷石) 石製品(石斧 石皿 石鏃 石製岩版) 抄H1~8、文199.205.218.230.237.258.269 H1~8年調査
Relacionado
Eu encontrei esses tópicos relacionados que se relacionavam com o problema, eles ajudaram um pouco, mas realmente não resolveram o problema.
Como obtenho o Excel para importar um arquivo CSV com vírgulas em alguns dos campos de conteúdo?
Importando o CSV para o Excel com vírgulas nos campos entre aspas
Como definir a codificação de caracteres ao abrir o Excel
atualização
No post "Como obtenho o Excel para importar um arquivo CSV com vírgulas em alguns dos campos de conteúdo?" a questão era devido a espaços entre as vírgulas entre campos e as seguintes aspas e valores. Nesse caso, espaços não são o problema, mas sim que as vírgulas são aninhadas entre parênteses e colchetes. Existe uma maneira de segmentar especificamente apenas as vírgulas que estão presentes entre parênteses e colchetes?
Tags japanese csv microsoft-excel