Skip to content

⛏ Projeto para a disciplina de Mineração de Dados: avaliação de candidatos para o vestibular da UEA

Notifications You must be signed in to change notification settings

gabrielSantosLima/data-mining-macro-uea

Repository files navigation

Análise de Candidatos ao Vestibular da UEA

UEA — Universidade do Estado do Amazonas
Curso: Sistemas de Informação
Matéria: Mineração de Dados

Sumário

Como Instalar

Requisitos

Ter instalado:

  • Python 3.10.5
  • VSCode (Visual Studio Code)

Windows

No Powershell, execute os seguintes passos (na raiz do projeto):

# configure project (create and change env, install dependencies)
.\configure.ps1

Agora você está apto a editar o arquivo main.ipynb.

Não se esqueça de alterar o ambiente virtual para o ambiente local que acabou de ser configurado. Clique aqui para saber mais.

Jupyter Notebook no VSCode

Geração de CSV

Caso queira gerar os arquivos csv da pasta /data/csv/ novamente, execute o seguinto comando na raíz do projeto:

.\venv\Scripts\python generator.py

Roadmap

🟢 Concluído | 🟡 Em andamento | 🔴 Não iniciado

Extração dos dados

  • 🟢 Busca dos dados brutos (vestibulares 2019-2022)
  • 🟢 Converter dados para um CSV

Pré-processamento dos dados

  • 🟢 Avaliação de qualidade dos dados
  • 🟡 Preparação de dados
  • 🟡 Preparação de dados (limpar dados)
  • 🟡 Preparação de dados (padronização)
  • 🟡 Preparação de dados (discretização)
  • 🟡 Preparação de dados (geração de novos atributos)
  • 🟡 Tratar dados com ética (LGPD)

Exploração

  • 🔴 Tratar outliers
  • 🔴 Seleção de características relevantes

Treinamento

  • 🔴 Réplica do estado da arte do contexto
  • 🔴 Aplicação de algoritmo supervisionado (ao - 2)
  • 🔴 Gerar modelo para a previsão
  • 🔴 Gerar modelo para determinar risco e probabilidade (?)
  • 🔴 Gerar modelo para localizar sequências de ações de cliente/usuário (?)
  • 🔴 Aplicação de medidas de similaridade e/ou dissimilaridade para o problema

Autores

  • Gabriel dos Santos Lima
  • Melinne Diniz de Oliveira
  • Lídia Dias de Souza

About

⛏ Projeto para a disciplina de Mineração de Dados: avaliação de candidatos para o vestibular da UEA

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published