GitHub - Osfory/My_Web_Scrapper: Experimental web-scraper for future data science applications

Example shows how to build and develop artifact using standard python ecosystem:

pip: for dependencies management
venv: for project isolation. By default python installs user or system wide dependencies
dependencies.txt contains pip dependencies and version for reproducible builds
src contains source code

Getting started:

Install venv for python project isolation: python -m venv .
Activate venv for shell: source bin/activate
Install manual declared dependencies: pip install -r dependencies.txt
Download chrome driver: https://sites.google.com/a/chromium.org/chromedriver/
You may open chrome with remote address: chromium --remote-debugging-port=9222 --user-data-dir=/tmp/chrometmp and connect to it using connect $PORT command: python src/headhunterScrapper.py /home/aleksey/PycharmProjects/Web_driver/chromedriver_linux64/chromedriver /home/aleksey/PycharmProjects/My_Web_Scrapper/dataset 1 2 connect 9222 (example)
Either use open command and just open new browser: python src/headhunterScrapper.py /home/aleksey/PycharmProjects/Web_driver/chromedriver_linux64/chromedriver /home/aleksey/PycharmProjects/My_Web_Scrapper/dataset all 1 open (example)

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
.idea		.idea
.vscode		.vscode
dataset		dataset
src		src
test_area		test_area
.gitignore		.gitignore
README.md		README.md
dependencies.txt		dependencies.txt

Provide feedback