Web-Scrapping

El proyecto consiste en la recopilación de información de documentos descalificados de páginas web como la CIA, Mossad y la NSA, el spider utilizado para la realización del scraping se encuentra dentro de IAgency, el cual generá un archivo cia.json que contiene el url, el titulo y el cuerpo del documento extraído de las páginas web. El archivo cia.json paso a ser utilizado para crear tarjetas dentro de una página web como ejemplo de lo que se puede hacer con web scraping.

Herramientas

Scrapy que es un framework de alto nivel el cual facilita el proceso de Web Scraping y Web Crawiling (Realización de Scrapy a lo largo del sitio web).
Python y el concepto de generadores
Hmtl
Css
JavaScript

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
IAgency		IAgency
cia		cia
src		src
.gitignore		.gitignore
README.md		README.md
index.html		index.html
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Web-Scrapping

Herramientas

About

Releases

Packages

Languages

RenatoCap/Web-Scrapping

Folders and files

Latest commit

History

Repository files navigation

Web-Scrapping

Herramientas

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages