Distribuição recomendada do Linux para estatísticas? [fechadas]

0

Dado que R , Python e muitas outras bibliotecas de código aberto usadas para estatísticas têm melhor suporte no Linux que no Windows / OSX (rPy vem à mente), acho estranho que ninguém tenha feito essa pergunta antes. Então eu faço agora:

Que pessoas da distribuição do Linux que fazem estatísticas / análise de dados / Machine Learning preferem / recomendam?

P.S: Eu me sinto um pouco envergonhado de perguntar isso, já que usando o gerenciamento de pacotes embutido do Python e do R eu teoricamente não estaria experimentando nenhum conflito com o sistema base. : P

    
por dmvianna 21.05.2013 / 15:32

1 resposta

4

Eu acho que o que você vai descobrir é que a distro não é importante. Especialmente se você estiver usando R e Python.

Normalmente, as pessoas gerenciam a própria versão do Python usando virtualenv ou virtualenvwrapper e instale os vários pacotes que eles desejam, em vez de tentar coexistir com o Python da distro.

A maioria das linguagens de programação como Perl, Python, Ruby e R fornecem essa camada de gerenciamento agora. Ruby tem rvm , Perl tem perlbrew e R tem Renv .

Além disso, eles fornecem sua própria camada de gerenciamento de pacotes para instalar as várias bibliotecas e ferramentas sistematicamente, de modo que a distribuição não é realmente importante em relação a esses tipos de ferramentas.

Exemplos

No meu laptop agora eu tenho várias versões do Ruby instaladas:

$ rvm list

rvm rubies

   ruby-1.9.2-head [ x86_64 ]
   jruby-1.5.6 [ amd64-java ]
   ruby-1.9.2-p290 [ x86_64 ]
=> ruby-1.9.2-p180 [ x86_64 ]
   ree-1.8.7-2011.03 [ x86_64 ]

Atualmente, estou configurado para usar o ruby-1.9.2-p290:

$ which ruby
~/.rvm/rubies/ruby-1.9.2-p180/bin/ruby

Esta versão também possui várias gems (bibliotecas) instaladas:

$ gem list|head -10
abstract (1.0.0)
actionmailer (3.0.10, 3.0.5)
actionpack (3.0.10, 3.0.5)
activemodel (3.0.10, 3.0.5)
activerecord (3.0.10, 3.0.5)
activeresource (3.0.10, 3.0.5)
activesupport (3.0.10, 3.0.5)
akami (1.2.0)
albino (1.3.3)
anemone (0.7.2)

A maioria das camadas de gerenciamento fornece os mesmos recursos que isso. Aqui está perlbrew , por exemplo:

$ perlbrew list
  local (5.14.0)
* perl-5.14.0

$ which perl
~/apps/perl5/perlbrew/perls/perl-5.14.0/bin/perl

Python & R não é diferente. A vantagem de gerenciar o ambiente dessa maneira é que todas as minhas instalações são mantidas no meu diretório pessoal, para que eu possa movê-las de máquina para máquina e mantê-las com meu trabalho, em vez de perder meu tempo gerenciando a distro para esses recursos. / p>     

por 21.05.2013 / 16:06