GitHub - JiacomoPassero/BDA_rotten-tomato-reviews-neo4j: Python Notebook Eseguibile per scaricare, pulire e analizzare un dataset preso da kaggle.

Per scaricare il dataset sono necessaria chiavi Kaggle da integrare nel progetto.

Deve essere creato database neo4j e avviato prima dell'esecuzione della parte denominata "Creazione database Neo4j", le credenziali di base di accesso sono:

username: neo4j

password: pomodoro

ma possono essere cambiate a piacimento.

Durante l'esecuzione del notebook sarà necessario di aggiungere dei file generati alla directory import del progetto neo4j creato.

Due query di creazione pur essendo sintatticamente corrette vanno in errore se lanciate da driver in python, purtroppo non ho trovato la causa del problema e le stesse query lanciate da terminale cypher funzionano senza problemi quindi per la parte di popolamento del dataset, in particolare dei nodi Movie e dei link REVIEWS sarà necessario un ulteriore step manuale lanciando le query di creazione di nodi, link e indici da terminale.

Tutte le altre operazioni compreso quelle di download del dataset da kaggle sono svolte eseguendo il notebook il codice.

Il notebook contiene assieme al codice le riflessioni sul dataset e sui risultati ottenuti dalla data analysis.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
RTR_Data_Analysis.ipynb		RTR_Data_Analysis.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

JiacomoPassero/BDA_rotten-tomato-reviews-neo4j

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages