Skip to content

El proyecto consiste en la recopilación de información de documentos descalificados de páginas web como la CIA, Mossad y la NSA.

Notifications You must be signed in to change notification settings

RenatoCap/Web-Scrapping

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Web-Scrapping


El proyecto consiste en la recopilación de información de documentos descalificados de páginas web como la CIA, Mossad y la NSA, el spider utilizado para la realización del scraping se encuentra dentro de IAgency, el cual generá un archivo cia.json que contiene el url, el titulo y el cuerpo del documento extraído de las páginas web. El archivo cia.json paso a ser utilizado para crear tarjetas dentro de una página web como ejemplo de lo que se puede hacer con web scraping.

Herramientas

  • Scrapy que es un framework de alto nivel el cual facilita el proceso de Web Scraping y Web Crawiling (Realización de Scrapy a lo largo del sitio web).
  • Python y el concepto de generadores
  • Hmtl
  • Css
  • JavaScript

About

El proyecto consiste en la recopilación de información de documentos descalificados de páginas web como la CIA, Mossad y la NSA.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published