Implementação do algoritmo Apriori utilizando as bibliotecas de MapReduce do Hadoop
- -i : arquivo de entrada
- -o : diretório de saída
- -s : suporte mínimo
- -c : confiança mínima
- -m : nível máximo de agrupamento (grupos com até m itens)
- Suporte mínimo (minSup): 0.15
- Confiança mínima: 0.7
- Nível máximo de agrupamento: 4
- HashMap <Integer, Double> conjItens → Conjunto com todos os itens com suporte > minSup. A chave (tipo Integer) é o item e o valor (tipo Double) é o suporte.
- Set<Set<Integer>> conjAtual → Conjunto de grupos de itens. É necessário para fazer a geração de grupos de tamanho k.
- HashMap<Set<Integer>, Double> conjTotal → Conjunto com todos os itens com tamanho k > 2 e suporte > minSup. A chave é o conjunto de itens (Set<Integer>) e o valor é o suporte.
- O tipo Integer se refere ao tipo de dados dos itens contidos no arquivo.
- As funções utilizam tipos de dados genéricos, porém o padrão utilizado é o tipo Integer.
- Para utilizar outro tipo de dados é basta mudar o tipo das estruturas descritas acima