Skip to content

Implementação do algoritmo Apriori utilizando as bibliotecas de MapReduce do Hadoop

Notifications You must be signed in to change notification settings

rafaelhribeiro/Apriori

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Apriori

Implementação do algoritmo Apriori utilizando as bibliotecas de MapReduce do Hadoop

Utilização do programa

Argumentos:

  • -i : arquivo de entrada
  • -o : diretório de saída
  • -s : suporte mínimo
  • -c : confiança mínima
  • -m : nível máximo de agrupamento (grupos com até m itens)
Os argumentos -i e -o são obrigatórios.

Defaults:

  • Suporte mínimo (minSup): 0.15
  • Confiança mínima: 0.7
  • Nível máximo de agrupamento: 4

Funcionamento.:

Estruturas.

  • HashMap <Integer, Double> conjItens → Conjunto com todos os itens com suporte > minSup. A chave (tipo Integer) é o item e o valor (tipo Double) é o suporte.
  • Set<Set<Integer>> conjAtual → Conjunto de grupos de itens. É necessário para fazer a geração de grupos de tamanho k.
  • HashMap<Set<Integer>, Double> conjTotal → Conjunto com todos os itens com tamanho k > 2 e suporte > minSup. A chave é o conjunto de itens (Set<Integer>) e o valor é o suporte.

Tipos:

  • O tipo Integer se refere ao tipo de dados dos itens contidos no arquivo.
  • As funções utilizam tipos de dados genéricos, porém o padrão utilizado é o tipo Integer.
  • Para utilizar outro tipo de dados é basta mudar o tipo das estruturas descritas acima

Obs.: O diretório de saída deve estar vazio

About

Implementação do algoritmo Apriori utilizando as bibliotecas de MapReduce do Hadoop

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages