Python实现豆瓣电影TOP250抓取,然后对爬取的数据进行分析。
安装 conda
+ jupyter
+ notebook
, 可以查看这篇教程
安装完后, 我本地出现了新建文件访问后 500 错误, 用以下命令解决即可
pip install --upgrade --user nbconvert
本部分包括:
豆瓣电影TOP250抓取思路分析---top250-spider.md
豆瓣电影TOP250抓取思路分析---top250-spider.ipynb
豆瓣电影TOP250抓取全部代码---top250-spider.py
抓取结果---top250_movie.csv
Excel打开不乱码的抓取结果---top250_movie_ANSI.csv