Skip to content

warrormac/suffixTree

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 

Repository files navigation

SufixTree

Proyecto final de EDA El proyecto tiene como objetivo procesar los datos y realizar busquedas exactas del siguiente conjunto de datos: https://www.kaggle.com/Cornell-University/arxiv

Preprosesamiento

El preprocesamiento fue realizado de una porcion del conjunto de datos que se muestra en la siguiente carpeta: https://drive.google.com/drive/u/2/folders/1SL_fTVyZkecPU8go4_0g8gF-0-ZeLsRv como unprocessedData.txt

El archivo tilin.txt son los datos procesados por el archivo get_abstract.py

Ejecutar el proyecto

Para ejecutar el proyecto solo es necesario descargar el archivo tilin.txt y ponerlo en la misma ruta que el archivo SuffixTree.cpp. Se compila y se ejecuta. Luego se tendra la opcion de realizar busquedas donde le pedira un patron a buscar en los datos indexados.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • C++ 74.0%
  • Python 26.0%