Use em pandas de python sep=',\s*'
em vez de sep=',\s+'
, ele tornará o espaço (s) opcional após cada vírgula:
file1 = pd.read_csv('sample.txt',sep=',\s*',skipinitialspace=True,quoting=csv.QUOTE_ALL,engine=python)
Vírgula dentro de aspas duplas é Ok, é permitido pelo padrão rfc4180.
Quanto a " "
dentro de valores de dados (como "valor" "13") - você precisará limpar o arquivo de origem antes do processamento. Se as aspas duplas permanecerem juntas, "" não deve ser um problema porque está em conformidade com o padrão CSV, ele chama aspas duplas de escape, mas se houver um espaço entre aspas duplas, será necessário limpá-lo
Uso:
sed -r 's/\"\s+\"/\"\"/g' src.csv >cleared.csv
antes de você fornecer CSV para os pandas. Isso removerá o espaço entre aspas ou será executado
sed -r 's/\"\s+\"//g' src.csv >cleared.csv
para remover completamente as aspas internas.