Download da Base de Dados

Fonte da Base de Dados: Kaggle

Clique no botão abaixo para fazer o download do arquivo de dados utilizado na análise.

Diagrama Knime

knime-workflow

Coeficiente de Silhuetas

Legenda:

  • Negativo: CS(i) abaixo de 0
  • Zero: CS(i) igual a 0

Algoritmo Clusters
2 3 4 5 6 7 8 9 10
k-Means negativo 0.371 negativo negativo negativo 0.346 negativo negativo 0.303
Fuzzy negativo negativo 0.366 0.372 negativo 0.396 0.385 0.371 0.333
k-Medoids negativo negativo negativo 0.249 0.248 0.282 negativo 0.320 0.319
Hierárquico (Manhattan) 0.722 zero zero zero zero zero zero zero zero
Hierárquico (Euclidean) zero zero zero zero zero zero zero zero zero

Gráficos

Gráfico 1

k-Means (3 Clusters)

Gráfico 2

Fuzzy (7 Clusters)

Gráfico 3

k-Medoids (9 Clusters)

Gráfico 4

Hierárquico-Manhattan (2 Clusters)

Conclusão

Considerando as Silhuetas e os Gráficos do melhor resultado de todos os algoritmos, chega-se à conclusão de que o melhor algoritmo a ser usado é o k-Means com 3 clusters pois este possui uma silhueta com valor minimamente bom e um gráfico com cluster bem formados.