优化不易，我用python

关键词挖掘 word.py

关键词挖掘是seoer一项非常重要的工作，挖掘关键词的好坏往往决定着获取流量的大小。

关键词的获取

预定义关键词

每个网站都有自己的定位，搞清楚这个很重要。用www.vrnew.com来举例，这是一个企业站，它的定位比较明确：产品展示，品牌宣传，咨询获取。所以预定义几个词,这几个词越短越好：

品牌词：华锐视点<- 北京华锐视点数字科技有限公司       
地域词：北京                       
行业词：vr|ar|虚拟现实|增强现实                     
业务词：内容制作|技术研发|解决方案

这些词的来源是通过：关于我们或者百科或者询问站长

关键词的获取途径

几家搜索引擎搜索结果相关搜索、SUG
几家大的社交、媒体（微博）的相关搜索
各搜索引擎的风云榜
竞价关键词获取工具（搜索引擎一般都提供）
百度司南工具
Log日志关键词数据
站内搜索关键词数据
商务通、商桥等在线咨询工具内的关键词
竞争对手网站上的tag页
竞争对手（尤其是对seo很重视的）站点title
竞争对手竞价关键词
竞争对手页面keyword
cnzz数据基于预定词以及获取途径，可以获取大量的关键词

关键词的分类

品牌词
业务词|行业词
衍生词

关键词的帅选怎么帅选关键词？怎么知道这些

我们先来给预设词打个分值：

ar	2
vr	5
虚拟现实	4
增强现实	1
华锐视点	5
制作	3
方案	3
技术	3
海淀	1
上地	1
北京	5
鞍山	2
深圳	4
教育	5
工业	5
家装	5

把它们放到一个个矩阵里（用表格表示把）

预设词/关系词	北京专业vr制作公司	北京AR房产公司	北京vr虚拟现实培训公司
ar	0	1	0
vr	1	0	1
虚拟现实	0	0	1
增强现实	0	0	0
制作	1	0	0
方案	0	0	0
技术	0	0	0
北京	1	0	1
公司	1	0	1

然后算这些词在长尾词或者文章标题的分值和，分值越高则相关度越高，设定一个及格线，就筛选出了相关度最高的一些词。

排名监控 monitor.py

搜索结果分析|竞争对手分析

分析搜索结果参数

> import monitor
> monitor.baidu_index("seo",0)
>  [{'data-click': None,
  'domain': 'baike.baidu.com/',
  'id': '1',
  'srcid': '91',
  'title': 'SEO_百度百科',
  'tpl': 'bk_polysemy'},.....]

关键词排名定位

监控优化关键词排名变化

>  import monitor
>  monitor.get_index_baidu("www.vrnew.com",*["华锐视点","vr","虚拟现实"])
> 
 [{'rank': ['1', '66', '93'], 'word': '华锐视点'},
 {'rank': ['86'], 'word': 'vr'},
 {'rank': ['48'], 'word': '虚拟现实'}]

page.py

一个链接：https://www.vrnew.com/index.php/News/newscontent/id/612

它的title
它的keywords
它的description
它的模拟抓取内容结果
它是否被baidu收录
它是否被so收录
它是否被sogou收录
它的内链有哪些共多少条
它的外链有哪些共多少条
它有哪些些词汇呢？举例：{url:"https://www.vrnew.com/index.php/News/newscontent/id/612 " ,wordlist=[("首页",433),("vr",23),("Vr公司",20),("华锐视点",10),("北京虚拟现实",10),("虚拟现实公司",10),("北京华锐视点_VR虚拟现实/AR增强现实内容制作公司",1)]}

site.py

在这个包里，想实现对服务器数据的抽取，以及网站相关信息的调查，还有一些数据的统计分析

目前有：

whois信息的抽取
domain->ip
服务器环境
robots文件的抽取
站点内所有的连接
baidu收录数统计以及已经收录的连接
so收录数据统计以及已经收录的连接
sogou收录数据统计以及以及收录的连接

一些功能：

生成网站地图
生成死链文档
友情链接检测
网站日志分析（限于iis日志，apache日志暂不能处理）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

优化不易，我用python

关键词挖掘 word.py

预定义关键词

关键词的获取途径

排名监控 monitor.py

搜索结果分析|竞争对手分析

关键词排名定位

page.py

site.py

目前有：

一些功能：

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 81 Commits
wordlist		wordlist
README.md		README.md
monitor.py		monitor.py
page.py		page.py
site.py		site.py

zoenbo/chinaseotools

Folders and files

Latest commit

History

Repository files navigation

优化不易，我用python

关键词挖掘 word.py

预定义关键词

关键词的获取途径

排名监控 monitor.py

搜索结果分析|竞争对手分析

关键词排名定位

page.py

site.py

目前有：

一些功能：

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages