Skip to content

Nono17/PythonSpider

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PythonSpider

** 廖雪峰python教程爬虫 **

  • 早就想看一下python的语法,一直没时间。最近闲下来了,在廖雪峰的python教程里看了和python相关的一些语法,觉得python真的很神奇,比起java和c真的是简洁又优雅。奈何只学到皮毛,还需要不断深入才行。

  • 光说不练哪行,于是就拿廖雪峰的官网开刀了..((^__^) 嘻嘻……).写了个简陋的爬虫,主要是为了熟悉一下python的语法。

  • 爬虫主要是通过GET来获取http的body,然后过滤不必要的信息,最后通过html2text来进行转换成markdown格式.html2text的文档在Internet上并没有太多..目前遇到的问题是转换img链接的时候,链接过长会换行,折腾了好久还是没找到解决办法...

  • 这个爬虫并没有任何的难度,纯属为了练习!!!

About

廖雪峰python教程爬虫

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%