tabela R-like consultando na linha de comando? [fechadas]

0

Existe uma maneira complexa de lidar com CSVs (e outros dados tabulares baseados em texto) na linha de comando do Linux? Eu sei que sed e csvkit tem muitos comandos úteis, mas eu estou procurando algo como R com estatísticas univariadas / multivariadas, agregações, subconjuntos complexos etc. também.

    
por Hendrik 07.09.2017 / 10:54

1 resposta

1

Para dados delimitados por tabulação, duas ferramentas que podem fazer operações estatísticas na linha de comando são datamash GNU e tsv -summarize de utilitários tsv do eBay (disclaimer: Eu sou o autor). Dos dois, o datamash do GNU possui um conjunto mais rico de operações estatísticas, mas ambas as ferramentas fornecem um valor único. Ambas as ferramentas funcionam bem com delimitadores que não sejam tabulação, incluindo vírgulas. No entanto, arquivos com escape CSV (vírgulas incorporadas ou novas linhas) exigem ferramentas com um analisador CSV real ou o uso de um conversor csv2tsv.

    
por JonDeg 08.09.2017 / 03:38