Qual é o delimitador do arquivo CSV abaixo?

0

Estou com problemas para importar o arquivo CSV, abaixo, para o Excel 2007. Não consigo descobrir qual é o delimitador.

"_id,""author_details"",""title"",""isbn"",""publisher"",""date_published"",""rating"",""bookshelf_id"",""bookshelf"",""read"",""series_details"",""pages"",""notes"",""list_price"",""anthology"",""location"",""read_start"",""read_end"",""format"",""signed"",""loaned_to"",""anthology_titles"",""description"",""genre"",""language"",""date_added"",""goodreads_book_id"",""last_goodreads_sync_date"",""last_update_date"",""book_uuid""," "1,""Varian, Hal R.|Medio, Alfredo"",""Microeconomia"",""9788875431730"",""Libreria Editrice Cafoscarina"",""2007-01-01"",""0"",""1,"",""Default,"",""0"","""",""756"","""","""",""0"","""","""","""",""Hardcover"",""0"","""","""",""Un testo affidabile per l'insegnamento della microeconomia sia a livello introduttivo che intermedio. Adottato come libro di testo in centinaia di università nel mondo. La sesta edizione (traduzione italiana della settima edizione americana) comprende un nuovo capitolo dedicato all'economia comportamentale, utile supplemento alla teoria classica del consumatore presentata nel resto del libro."",""Business & Economics / Economics / Microeconomics"",""Italian"",""2015-07-31 14:05:12"",""0"",""0000-00-00"",""2015-07-31 14:05:12"",""77814bda007623652cee9cb45d523fe8"","

Parece-me que o delimitador é "," , mas isso vale para todos os campos, exceto o que está entre o primeiro e o segundo campo. Tem algo que estou perdendo?

A propósito, o CSV foi exportado do aplicativo Android "Catálogo de livros", um aplicativo para criar sua própria biblioteca, digitalizando os códigos de barra na parte de trás de seus livros.

    
por deodato 31.07.2015 / 18:33

3 respostas

0

Dada a estrutura do arquivo e o fato de que os autores estão listados Last, First - você precisa de uma maneira de especificar qual , é o delimitador.

Eu faria uma descoberta e substituiria todos os "" e " a (espaço em branco, nada), então você pode delimitar qualquer , precedido por um espaço em branco (que não pode ser mostrado na marcação aparentemente).

Se eu fosse você, tentaria exportá-lo novamente:

Então baixei o aplicativo e enviei um csv, não estou tendo o mesmo problema que você -

"_id","author_details","title","isbn","publisher","date_published","rating","bookshelf_id","bookshelf","read","series_details","pages","notes","list_price","anthology","location","read_start","read_end","format","signed","loaned_to","anthology_titles","description","genre","language","date_added","goodreads_book_id","last_goodreads_sync_date","last_update_date","book_uuid", "1","ISACA, ","Cisa Review Manual 2013","9781604203004","Ingram","2013-01-17","0","1,","Default,","0","","430","","","0","","","","Paperback","0","","","

The CISA Review Manual 2013 is a comprehensive reference guide to help individuals prepare for the CISA exam and understand the roles and responsibilities of an information systems (IS) auditor. The manual has been enhanced over the past editions and represents the most current, comprehensive, peer-reviewed IS audit, assurance, security and control resource available worldwide.

The 2013 manual is organized to assist candidates in understanding essential concepts and studying the following job practice areas:

  • The Process of Auditing Information Systems
  • Governance and Management of IT
  • Information Systems Acquisition, Development and Implementation
  • Information Systems Operations, Maintenance and Support
  • Protection of Information Assets

The CISA Review Manual 2013 also features an easy-to-use format. Each of the five chapters has been divided into two sections for focused study. Section one of each chapter contains the definitions and objectives for the five areas, as well as the corresponding tasks performed by IS auditors and knowledge statements (required to plan, manage and perform IS audits) that are tested on the exam. It also includes:

  • A map of the relationship of each task to the knowledge statements
  • A reference guide for the knowledge statements, including the relevant concepts and explanations
  • References to specific content in section two for each knowledge statement
  • Self-assessment questions and explanations of the answers
  • Suggested resources for further study

Section two of each chapter consists of reference material and content that supports the knowledge statements. The material enhances CISA candidates' knowledge and/or understanding when preparing for the CISA certifications exam. In addition, the CISA Review Manual 2013 includes the brief chapter summaries focused on the main topics and case studies to assist candidates in understanding current practices. Also included are definitions of terms most commonly found on the exam.

This manual is excellent as a stand-alone document for individual study, as a guide or reference fir study groups and chapters conducting local review course, and it can also be used in conjunction with the CISA Review Questions, Answers, & Explanations Manual 2013 and the CISA Review Questions, Answers & Explanations Manual 2013 Supplement. The manual also serves as an effective desk reference for IS auditors.

","","English","2015-07-31 17:23:46","0","0000-00-00","2015-07-31 17:23:46","ece4a3abc4aca96480e462ec4e8ffc3a",

E o excel não tem problema com isso -

    
por 31.07.2015 / 19:15
1

Parece que cada linha inteira é encapsulada em aspas duplas 1 , portanto:

"<line>"

Em seguida, a primeira coluna não tem aspas duplas (apenas a), mas as colunas subsequentes são duplamente citadas em dobro.

Finalmente, há uma vírgula estranha no final.

Assim, cada linha finalmente assume a forma de (eu adotei espaços para aumentar a clareza):

" <id>, ""<column2>"" , ""<column3>"" , ""<column4>"" , ""<column5>"" , "

Por isso, eu diria que o delimitador é uma vírgula, mas antes de processar a linha, você precisa remover as primeiras e últimas aspas de cada linha e então as double aspas duplas ( "" ) ao redor de cada coluna (além da primeira).

Parece que o aplicativo para Android está adicionando um "envolvimento extra" (de duas marcas de fala de cada lado) em torno de todas as colunas, barre a primeira e, em seguida, encapsulando a linha inteira entre aspas duplas.

Então, isso é um CSV, ou seja, um arquivo separado por vírgulas , afinal.

1 Aspas duplas a.k.a. Marcas de fala

    
por 31.07.2015 / 19:07
0

parece um arquivo csv comum para mim MAS

o primeiro registro contém uma única coluna com o valor

_id,"author_details","title","isbn","publisher","date_published","rating","bookshelf_id","bookshelf","read","series_details","pages","notes","list_price","anthology","location","read_start","read_end","format","signed","loaned_to","anthology_titles","description","genre","language","date_added","goodreads_book_id","last_goodreads_sync_date","last_update_date","book_uuid",

que se parece com dados CSV válidos, parece que o criador codificou cada registro duas vezes.

    
por 02.08.2015 / 09:14