A estatística é uma ciência muito utilizada e difundida na
sociedade, as pessoas são bombardeadas com informações estatísticas
diariamente, empresas utilizam de ferramentas estatísticas em todos os seus
departamentos, extraindo e analisando informações de todos os seus stakeholders e de seu ambiente interno e
externo de modo geral.
Em uma pesquisa rápida é visto que de maneira geral a
estatística é definida como um conjunto de técnicas que servem para coletar,
organizar, descrever, analisar e interpretar dados, os quais são oriundos de
experimentos ou estudos observacionais.
O que deve se explicitar é que na maioria das vezes
profissionais que utilizam das ferramentas estatística necessitam trabalhar com
banco de dados muito extensos e os dados coletados podem não estar em formato
ideal para ser trabalhados em suítes de escritórios ou outras ferramentas já
existentes. Por isso a aplicação da programação em estatística é extremamente
importante, pois além de facilitar a manipulação de dados os pacotes estatísticos
permitem ao profissional modificar e escrever o código, montando as ferramentas
computacionais necessárias para resolver os seus problemas de análise de dados
de forma especifica e de modo mais eficaz.
Portanto, esse post tem o objetivo de comparar dois pacotes
estatísticos muito utilizados, o R e o SPSS statistics, e concluir qual o
pacote ideal para se especializar.
A utilização de softwares estatísticos requer um adequado
conhecimento de técnicas estatísticas envolvidas.
Software R
O Software R definido por alguns autores como não sendo um
pacote estatístico e sim “como um sistema integrado que permite a execução de
tarefas em estatística”, é ao mesmo tempo uma linguagem de programação e um
ambiente para computação estatística e gráfica e foi criado em 1996 por Ross
Ihaka e Robert Gentleman.
Principais pontos fortes de R são:
·
Apresentar fonte de código aberto o que
proporciona ao R ser altamente expansível, podendo ser modificado ou
implementado com novas funções de modo continuo e mais rápido que os outros pacotes,
pois qualquer pessoa pode desenvolver essas novas extensões;
·
Contar com um grande número de colaboradores das
mais diversas áreas do conhecimento;
·
Contêm diversos mecanismos incorporados para a organização
de dados, execução de cálculos sobre informações e criação de representações
gráficas de conjuntos de dados;
·
É gratuito e o site que fornece também dispõe
informação sobre a sua utilização e uma central de correspondências onde
profissionais de várias áreas do conhecimento podem contribuir na implementação
de novos recursos e responder a dúvidas dos demais usuários;
·
Por ser uma linguagem de programação orientada a
objetos o usuário pode criar suas próprias funções, e sua própria rotina na
análise de dados;
·
É fácil escrever formulas complexas em R.
Praticamente todos os tipos de testes e modelos estatísticos estão disponíveis
para uso na linguagem.
Principais Pontos Fracos:
·
Mesmo podendo ser otimizado, R foi feito com
cunho de análise e não se preocupou tanto com velocidade e o não conhecimento
da programação por parte da maioria dos usuários realçam esse aspecto pois
criam códigos menos eficientes do ponto de vista de velocidade.
·
Maior dificuldade na inserção de dados, a
inserção de dados é mais fácil por meio de importação de outras ferramentas
·
Tarefas comuns ficam mais complexas se comparado
a outros pacotes
Não possui uma plataforma em menus e os usuários que nunca possuíram
contato com programação podem preferir outras plataformas
Interface do R |
Software SPSS
O software SPSS foi
desenvolvido em 1968 por Norman H. Nie, Dale H. Bent e C. Hadlai Hull e em 2009 foi vendido
para a IBM, que só passou a ser totalmente dela em 2010. O SPSS apesar
de ser acionado pelo menu também possui uma linguagem de programação própria,
como uma extensão, a linguagem Python pode acessar as informações no dicionário de
dados e criar programas de sintaxe de
comando.
Principais pontos fortes de SPSS são:
·
A interface gráfica do usuário é
composta de duas visualizações, sendo uma de visualização
de dados e a outra de variáveis, como o próprio nome diz uma exibe os dados
inseridos e a outra as características das variáveis (que seriam os
“títulos” das colunas, por exemplo: sexo seria uma variável e embaixo dessa
variável ne uma tabela conteria a frequência masculino ou feminino). Além disso
existe uma janela de edição, caso da que foi citada e janela de visualização.
·
As funções do pacote podem ser acessadas pelo
menu pull-down/menu suspenso, ou seja, não é necessariamente preciso escrever
linhas de comando, é possível realizar uma função escolhendo o que se deseja no
menu, deixando o software muito mais usual.
·
Contêm diversos mecanismos incorporados para a
organização de dados, execução de cálculos sobre informações e criação de
representações gráficas de conjuntos de dados;
·
A extensão Python permite que o SPSS execute
qualquer uma das estatísticas no pacote de software livre R
Principais
pontos fracos de SPSS são:
·
O Software é pago e é muito caro, ele é vendido
em diferentes níveis de preço de acordo com as funções adicionadas, a licença
de um ano do programa, para um único usuário, mais básico é R$ 4.624,72 e do
mais completo é R$ 30.767,74.
Interfaces das duas Janelas de SPSS Statistics |
Tabela Comparativa dos dos pacotes
Ambos os pacotes são amplamente utilizados, mas apesar da
facilidade, ou melhor, da usabilidade do SPSS ser muito maior, a tendência em
que as empresas adotem R é muito grande, pelo seu cunho gratuito e
continuamente extensível. Empresas como: Google, Pfizer, Merck, Bank of
América, InterContinental Hotels Group e Shell, estão usando a linguagem R.
Há uma aceitação por R muito grande de pessoas que não tem
domínio de programação, inclusive estas consideram uma ferramenta fácil de ser
utilizada. R também possui uma imensa quantidade de material online, inclusive
um site especifico de conteúdos e “atualizações”. Outro ponto é que muitos
novos desenvolvimentos na área de estatística, aparecem primeiro como pacotes
R, para depois serem incorporados nos softwares comerciais.
Diante dos pontos expostos conclui-se que o pacote R seja o
melhor para se obter uma especialização, devido a todas as suas vantagens em
relação ao SPSS e a tendência crescente de utilização dele por empresas.
Próximos
posts podem explorar mais as definições de pacotes estatísticos e procurar
despertar interesse em estudantes e profissionais a utilizarem e se
especializarem nestes softwares.
Para mais informações, acesse os links:
Nenhum comentário:
Postar um comentário