1 of 15

Slide Notes

DownloadGo Live

RapidMiner X WEKA

Published on Mar 17, 2016

No Description

PRESENTATION OUTLINE

RapidMiner e WEKA

Mineração de dados
Photo by Leo Reynolds

Vivemos em uma era onde a mineração de dados é um fator muito importante se tratando, por exemplo, do fato de obter uma vantagem no mercado sobre a concorrência. Mineração de dados pode ser utilizada em diversas áreas, como administrativa, científica, comercial, educacional, governamental, social, entre outras.

Untitled Slide

  • Bancos: identificar padrões para auxiliar no gerenciamento de relacionamento com o cliente;
  • Cartão de Crédito: identificar segmentos de mercado, identificar padrões de rotatividade;
  • Cobrança: detecção de fraudes;
  • Telemarketing: acesso facilitado aos dados do cliente;
  • Segurança: na detecção de atividades terroristas e criminais;
  • RH: identificação de competências em currículos;

WEKA

Photo by SidPix

Weka é um Software livre do tipo open source para mineração de dados, desenvolvido em Java, dentro das especificações da GPL (General Public License).

Seu ponto forte é a tarefa de classificação, mas também é capaz de minerar regras de associação e clusters de dados. Pode ser utilizada no modo console ou através da interface gráfica Weka Explorer. Ao longo dos anos se consolidou como a ferramenta de data mining mais utilizada em ambiente acadêmico.

Untitled Slide

  • Software Livre
  • Portabilidade
  • Uma coleção completa de dados de pré-processamento e técnicas de modelagem
  • Facilidade de utilização com sua interfaces gráficas de usuário

O WEKA é uma excelente ferramenta de mineração de dados principalmente para iniciantes no qual é uma ferramenta que tem uma curva de aprendizado menor comparado ao R.

Entretanto uma ferramenta também open source que vem agradando diversos praticantes de mineração de dados é o Rapidminer que conta com uma suíte bem sugestiva e tem uma curva de aprendizado muito baixa, além de contar com possibilidade de se realizar ETL de alguns dados na própria suíte.

RapidMiner

Photo by brickstuff

O RapidMiner tem como principais diferenciais a parte de pré-processamento de dados, a baixa curva de aprendizado para início dos trabalhos em mineração de dados, além de produzir gráficos de ótima qualidade.

O RapidMiner tem como desvantagem o “travamento” de diversos recursos que são liberados somente com a versão paga, não ter uma comunidade tão ativa, e pouca documentação (livros) dirigidos para o seu uso prático.

IMPLEMENTAÇÃO

Photo by Tim Gillin

RapidMiner X WEKA

Photo by jiazi

Untitled Slide

  • O RapidMiner pode lidar com conjuntos de dados maiores do que o Weka
  • O consumo de memória do RapidMiner é menor em relação ao Weka, mesmo lidando com um conjunto maior de dados

FIM DE PAPO

Photo by luc legay

Untitled Slide