title | author | date | output | language |
---|---|---|---|---|
webscraping |
Fernando Villalba Bergado |
10 de octubre de 2016 |
rtf_document |
Español |
En esta serie de capítulos, voy a poner muchos ejemplos de cómo hacer webscraping, partiendo de cero.
Se trata de aprender haciendo, por lo que iré poniendo ejemplos explicados que tracen una ruta de aprendizaje para desarrollar R en el tema del rascado web o webscraping.
Cada vez que termine un capítulo actualizaré esta lista con los enlaces a los ficheros correspondientes:
- [CAPITULO 1. PRIMEROS PASOS CON WEBSCARPING Y R](01_primeros pasos.md)
- CAPITULO 2. BAJAR DATOS
- CAPITULO 3. EJECUTAR FORMULARIOS
Para hacer este manual de R y webscraping he usado las caracteristicas de edición de ficheros markdown de RSTUDIO y Git. He enlazado RSTUDIO con GitHub para así practicar el uso de esta web como archivo y gestor de versiones de código.
Trabajo en modo local en RSTUDIO y cuando tengo cambios importantes los subo (push) directamente con RSTUDIOGit.
Para que RSTUDIO reconozca el directorio local y lo enlace con GitHub he tenido que poner en GitBAsh el enlace remoto, actualizar el STAGE del repo hace un commit general y por ultimo subir todo el repo a GitHub:
$ git remote add origin https://github.com/fervilber/webscraping.git
$ git add -A
$ git commit -m "actualiza todo"
$ git push -u origin master
Este es el enlace al repo de GitHub con la documentacion de este trabajo.
Hecho esto, RSTUDIO reconoce el enlace y permite ya trabajar desde la ventana de git en RSTUDIO, de forma muy simple.