Skip to content

Representación y análisis no supervisado de la opinión de un diario usando embeddings Word2Vec y análisis de variedades topológicas T-SNE y UMAP.

Notifications You must be signed in to change notification settings

Huguet57/Information-Contrast

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 

Repository files navigation

Contraste de información en tiempos del COVID-19

¿Son las noticias de un medio de información objetivas y imparciales? ¿Podemos definir las relaciones entre los conceptos hablados en la sección de opinión para obtener una fotografía de cómo piensa un medio particular?

Esto es lo que hemos estudiado y analizado en esta Hackathon. Obteniendo datos mediante web-scrapping y analizándolos sin supervisar con técnicas de análisis multivariante y inferencia de variedades geométricas, aplicadas a los datos codificados con la tecnología Word2Vec. Hemos obtenido resultados, sorprendentemente acertados, sobre las relaciones de los conceptos y opiniones del diario digital líder en España, "El Español".

Todos los resultados han estado recogidos en el notebook que hemos confeccionado en estas 12 horas. Finalmente, hemos confeccionado un mapa que representa las relaciones y distancias entre los temas. Aquí debajo se puede ver cómo es este mapa.

Zonas particulares del mapa

"Cataluña", "155", "Victimismo", "Procés", "Huidos"...

Catalunya concept map

"Corrupción", "Gúrtel", "Cifuentes", "Máster", "Esperanza"...

Corrupción concept map

"Gobierno", "Derecha", "Pactar", "Mayorías", "Bloqueo"...

Gobierno concept map

"Internacional", "Trump", "Refugiados", "China", "Climático"...

Internacional concept map

"Delito", "Forcadell", "Exconsejeros", "Malversación", "Llarena"...

Presos concept map

"Coronavirus", "Yihadista", "Immigrantes", "Economía", "Empleo"...

Coronavirus concept map

El mapa completo

UMAP global map Podemos ver que en el mapa, los datos tienen un sentido global. Es decir, podemos ver en el norte palabras relacionadas en notícias internacionales. En el sur, vemos palabras involucrando crímenes, corrupción y prisión. En la derecha palabras sobre gobiernabilidad, ideologías y partidos políticos. Finalmente, en la izquierda vemos las palabras más numéricas de notícias involucrando datos.

About

Representación y análisis no supervisado de la opinión de un diario usando embeddings Word2Vec y análisis de variedades topológicas T-SNE y UMAP.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published