Skip to content

Danielyan86/Movie-scrapy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

准备环境安装

  • 测试环境 MacOS-10.15.4
  • python 版本3.6.10
  • pip install -r requirements.txt

安装MongoDB

运行

执行爬虫

  • 此程序有两个爬虫,一个mtime是爬取电影名字,年代和页面链接放入本地mongoDB,另外一个是下载图片到本地文件夹

运行数据爬虫

  • scrapy crawl mtime 注意需要修改setting 中的ITEM_PIPELINES配置为movie.pipelines.MoviePipeline, mobie_data

运行图片爬虫

  • scrapy crawl mPicture
  • 注意需要修改setting 中的ITEM_PIPELINES配置为 movie.pipelines.MyImagesPipeline,
  • ITEM_PIPELINES中的IMAGES_STORE为图片文件保存路径
  • IMAGES_MIN_HEIGHT和IMAGES_MIN_WIDTH为图片筛选参数,只有大于这个尺寸图片才会被保存在本地 movie_pictures

更多详细介绍

About

时光网电影数据和海报爬虫

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages