Skip to content

爬取去哪网热门景点信息,抽取三元组信息,构建中文知识图谱

Notifications You must be signed in to change notification settings

xxrz/WEB_qunaer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

WEB知识图谱构建

  • 利用scrapy框架爬取去哪儿网热门景点信息
  • 抽取三元组信息(存入mongdb数据库)
  • 构建中文知识图谱(存入neo4j数据库)

环境构建

  • Windows 10(也可在ubuntu)
  • python 3.7
  • mongdb 安装可参考此处
  • neo4j 安装可参考此处

注意:在python环境中需要安装 neo4j-driver

快速开始

  1. 启动mongo服务

    $ net start MongDB

    注意:需要管理员权限

  2. 启动neo4j服务

    $ neo4j start

    注意:需要在neo4j的安装目录下运行命令

  3. 连接Neo4j Browser

  4. 运行run.py

    $ cd WEB_qunaer/qunaer/spiders

    $ python run.py

运行效果

  • 爬虫运行界面 1
  • mongdb存储去哪儿信息 2
  • mongdb存储三元组信息 3
  • 知识图谱结果 4

最后感谢WEB_KG!

About

爬取去哪网热门景点信息,抽取三元组信息,构建中文知识图谱

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages