terça-feira, 6 de junho de 2017

Qual Pacote estatístico é o Ideal para se especializar?

A estatística é uma ciência muito utilizada e difundida na sociedade, as pessoas são bombardeadas com informações estatísticas diariamente, empresas utilizam de ferramentas estatísticas em todos os seus departamentos, extraindo e analisando informações de todos os seus stakeholders e de seu ambiente interno e externo de modo geral.
Em uma pesquisa rápida é visto que de maneira geral a estatística é definida como um conjunto de técnicas que servem para coletar, organizar, descrever, analisar e interpretar dados, os quais são oriundos de experimentos ou estudos observacionais.
O que deve se explicitar é que na maioria das vezes profissionais que utilizam das ferramentas estatística necessitam trabalhar com banco de dados muito extensos e os dados coletados podem não estar em formato ideal para ser trabalhados em suítes de escritórios ou outras ferramentas já existentes. Por isso a aplicação da programação em estatística é extremamente importante, pois além de facilitar a manipulação de dados os pacotes estatísticos permitem ao profissional modificar e escrever o código, montando as ferramentas computacionais necessárias para resolver os seus problemas de análise de dados de forma especifica e de modo mais eficaz.
Portanto, esse post tem o objetivo de comparar dois pacotes estatísticos muito utilizados, o R e o SPSS statistics, e concluir qual o pacote ideal para se especializar.




A utilização de softwares estatísticos requer um adequado conhecimento de técnicas estatísticas envolvidas.

Software R

O Software R definido por alguns autores como não sendo um pacote estatístico e sim “como um sistema integrado que permite a execução de tarefas em estatística”, é ao mesmo tempo uma linguagem de programação e um ambiente para computação estatística e gráfica e foi criado em 1996 por Ross Ihaka e Robert Gentleman.

Principais pontos fortes de R são:

·         Apresentar fonte de código aberto o que proporciona ao R ser altamente expansível, podendo ser modificado ou implementado com novas funções de modo continuo e mais rápido que os outros pacotes, pois qualquer pessoa pode desenvolver essas novas extensões;
·         Contar com um grande número de colaboradores das mais diversas áreas do conhecimento;
·         Contêm diversos mecanismos incorporados para a organização de dados, execução de cálculos sobre informações e criação de representações gráficas de conjuntos de dados;
·         É gratuito e o site que fornece também dispõe informação sobre a sua utilização e uma central de correspondências onde profissionais de várias áreas do conhecimento podem contribuir na implementação de novos recursos e responder a dúvidas dos demais usuários;
·         Por ser uma linguagem de programação orientada a objetos o usuário pode criar suas próprias funções, e sua própria rotina na análise de dados;
·         É fácil escrever formulas complexas em R. Praticamente todos os tipos de testes e modelos estatísticos estão disponíveis para uso na linguagem.
·         R integra-se facilmente com o sistema de publicação de documentos LaTeX


Principais Pontos Fracos: 

·         Mesmo podendo ser otimizado, R foi feito com cunho de análise e não se preocupou tanto com velocidade e o não conhecimento da programação por parte da maioria dos usuários realçam esse aspecto pois criam códigos menos eficientes do ponto de vista de velocidade.
·         Maior dificuldade na inserção de dados, a inserção de dados é mais fácil por meio de importação de outras ferramentas
·         Tarefas comuns ficam mais complexas se comparado a outros pacotes
Não possui uma plataforma em menus e os usuários que nunca possuíram contato com programação podem preferir outras plataformas 
Interface do R

Software SPSS

O software SPSS foi desenvolvido em 1968 por Norman H. Nie, Dale H. Bent e C. Hadlai Hull e em 2009 foi vendido para a IBM, que só passou a ser totalmente dela em 2010. O SPSS  apesar de ser acionado pelo menu também possui uma linguagem de programação própria, como uma extensão, a linguagem Python pode acessar as informações no dicionário de dados  e criar programas de sintaxe de comando.

Principais pontos fortes de SPSS são:
·         interface gráfica do usuário é composta de duas visualizações, sendo uma de visualização de dados e a outra de variáveis, como o próprio nome diz uma exibe os dados inseridos  e a outra as características das variáveis (que seriam os “títulos” das colunas, por exemplo: sexo seria uma variável e embaixo dessa variável ne uma tabela conteria a frequência masculino ou feminino). Além disso existe uma janela de edição, caso da que foi citada e janela de visualização.
·         As funções do pacote podem ser acessadas pelo menu pull-down/menu suspenso, ou seja, não é necessariamente preciso escrever linhas de comando, é possível realizar uma função escolhendo o que se deseja no menu, deixando o software muito mais usual.
·         Contêm diversos mecanismos incorporados para a organização de dados, execução de cálculos sobre informações e criação de representações gráficas de conjuntos de dados;
·         A extensão Python permite que o SPSS execute qualquer uma das estatísticas no pacote de software livre R

Principais pontos fracos de SPSS são:

·         O Software é pago e é muito caro, ele é vendido em diferentes níveis de preço de acordo com as funções adicionadas, a licença de um ano do programa, para um único usuário, mais básico é R$ 4.624,72 e do mais completo é R$ 30.767,74.

Interfaces das duas Janelas de SPSS Statistics

Tabela Comparativa dos dos pacotes




Ambos os pacotes são amplamente utilizados, mas apesar da facilidade, ou melhor, da usabilidade do SPSS ser muito maior, a tendência em que as empresas adotem R é muito grande, pelo seu cunho gratuito e continuamente extensível. Empresas como: Google, Pfizer, Merck, Bank of América, InterContinental Hotels Group e Shell, estão usando a linguagem R.
Há uma aceitação por R muito grande de pessoas que não tem domínio de programação, inclusive estas consideram uma ferramenta fácil de ser utilizada. R também possui uma imensa quantidade de material online, inclusive um site especifico de conteúdos e “atualizações”. Outro ponto é que muitos novos desenvolvimentos na área de estatística, aparecem primeiro como pacotes R, para depois serem incorporados nos softwares comerciais.
Diante dos pontos expostos conclui-se que o pacote R seja o melhor para se obter uma especialização, devido a todas as suas vantagens em relação ao SPSS e a tendência crescente de utilização dele por empresas.
Próximos posts podem explorar mais as definições de pacotes estatísticos e procurar despertar interesse em estudantes e profissionais a utilizarem e se especializarem nestes softwares.

Para mais informações, acesse os links: 



Nenhum comentário:

Postar um comentário