weibo

为方便使用合并各种文件到Lweibo.py，并且支持Python3，完全不懂的小白请修改config.ini后打开example.py按需运行，运行抓取任务时请下载完全整个文件，不要就下载一个py文件问为什么出错

关于出现RuntimeError: 20019 repeat content! 问题是新浪最近的小动作，抓取间隔过小会抛错，这个我没办法破

Lweibo.py 提供了API方式和模拟登录的方式，如有问题email我吧（不要向我所要todo的，说了毕业后放出，希望理解一个硕士是需要毕业的，放出来很可能我的毕设变成抄袭！都是很简单的功能，自己写一下么）

利用python实现对新浪微博的抓取

此爬虫使用了@lxyu 的SDK https://github.com/lxyu/weibo 感谢他之前的工作

2015年08月05日更新

支持Python3！

TODO

~~1.模拟登录，并抓取某个页面~~

~~2.对页面解析~~

3.定时任务（已完成，毕业后放出）

4.分布式存储HBase（已完成，毕业后放出）

5.通过API调取活跃用户ID，避免自曾产生僵尸用户数据（已完成，毕业后放出）

Name		Name	Last commit message	Last commit date
Latest commit History 69 Commits
test		test
.gitignore		.gitignore
LICENSE		LICENSE
Lweibo.py		Lweibo.py
README.md		README.md
config.ini		config.ini
example.py		example.py