Skip to content

这是一个淘宝爬虫,填写任意一个淘宝链接可抓取此淘宝店铺的所有信息(店铺名字,店铺信用,店铺ID,所有的商品 价格 优惠 销量 图片 等等)

Notifications You must be signed in to change notification settings

8treenet/taobao_spider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

#taobaoSprider #介绍 #作者使用 ubuntu系统

  1. sudo apt-get install libfontconfig
  2. git clone [email protected]:yangshu369/taobaoSprider.git

#下载安装 PhantomJS https://phantomjs.org/download.html #作者使用执行文件,源码安装自行研究. 淘宝有各种重定向和异步加载,PhantomJS基于webkit 浏览器渲染方式,更加稳妥,相对慢一些. 可自行修改curl方式

  1. wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2

  2. tar -xf phantomjs-2.1.1-linux-x86_64.tar.bz2

  3. cd phantomjs-2.1.1-linux-x86_64/bin/

  4. ./phantomjs -v 2.1.1

#移动phantomjs到项目bin 目录下 7. mv phantomjs 你的/taobaoSprider/bin

#cd xxx 进入项目根目录taobaoSprider 8. php Execute.php

#2.0 coding中........ .数据库 .多线程 .分布式

About

这是一个淘宝爬虫,填写任意一个淘宝链接可抓取此淘宝店铺的所有信息(店铺名字,店铺信用,店铺ID,所有的商品 价格 优惠 销量 图片 等等)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages