Repositório para disponibilização de bases de dados do Wikipedia e Simple Wikipedia pré-processadas, além de scripts de pré-processamento e geração de bases em Python.
python
database
wikipedia
python3
weka
readability
corpus-data
corpus-tools
ingles
wikipedia-corpus
corpus-processing
portuguese-brazilian
base-de-dados
legibilidade
-
Updated
Jan 19, 2023