永久免费开源的导师评价数据、数据爬虫、无需编程基础的展示网页以及新信息补充平台
我写了一个简单的UI方便检索,可以通过如下方式访问:
- 在线浏览:可以直接访问这个GitHub Pages页面,打开即可在线浏览数据。网页前端加载出来之后,要加载一个20MB左右的js数据文件,由于网络原因可能速度比较慢,所以会有一小段时间下拉列表里没有数据,请耐心等待。
- 离线浏览:点击右上方Code按钮中的Download ZIP,下载文件,然后打开
html/index.html
即可浏览数据。由于调用了bootstrap
和jquery
,所以打开的时候最好保持网络连接(不打开也行啦,就是UI可能有点乱)。
小TIP:
- 如果对GitHub不太熟悉,请直接选择在线浏览。
- 如果考虑到各种不可抗因素,离线浏览的方式更加安全(毕竟也不知道github有没有不能访问的一天)。
为了支持离线浏览,也可以转换成相关的应用app。
- 安卓APK,有朋友在这条issue下提供了将此静态网页转换为安卓APK的工具及转换成品,有需要的朋友可以前往查看和下载。
- 苹果App,暂时还不支持,欢迎各位提供相关的技术
data
目录下储存了原始数据,其中:
urfire.json
是从导师推荐网 获取的原始数据,该网站目前正常运作,各位也可以前往支持,本平台开源存储数据以备各种你懂得的不可抗力因素。该网站目前已停止服务,但目前已经有一些在本repo数据基础上完成的网站,详情参见issue部分。本repo仍然为大家永久提供数据存储、下载和查询服务。comments_data.json
是将数据转换为如下格式的json
数据
[
{
"school_cate": "",
"university": "",
"department": "",
"supervisor": "",
"rate": 0,
"description": ""
}
]
src/urfire.py
是导师推荐网的爬虫工具,并包含了一个并行爬取的实例。另有将原始格式转换为上述comments_data.json
格式的函数。
html/index.html
是使用bootstrap
和jquery
完成的简易的检索页面。数据存储在html/data.js
中,由src/html_render.py
通过comments_data.json
生成。
我会不定期继续爬取其他数据,有数据的地方也烦请告知。
另外,朋友们也可以在本平台撰写评价,请前往这条issue:在本issue下补充导师评价信息,发帖请使用如下格式,方便爬虫爬取:
学校类型:985/211/研究机构/其他/(海外院校请用英文直接填写国家名称,如:Japan) 学校名称:示例:清化大学/Cambridge University
院系:示例:化学化工学院/无
导师姓名:示例:王五
评分:(1-5分制,乐意的话可以填写小数,如:4.8)
评价:示例:对学生很好,尽职尽责
我也会不定期爬取issue数据添加进来。
GiHub平台匿名评价比较麻烦,可以考虑使用匿名评论公用账号
祝各位都能有一个顺利美好的研究生生活。
虽然维护这个repo需要一定的时间,但是我乐意为大家做这件事,而且大家也随时可以给我发pull request一起维护这个repo。而且这些数据的主体来源是每一位辛苦的科研工作人员的宝贵经验和建议,而不是我的,我只是把他们的数据收集储存起来,因此这个repo不打算接受任何捐赠。
目前urfire网站已经关站,如果任何一位朋友(或者未来如果我有空的话)愿意重新建站,我希望TA能够在TA的网站上开放捐赠,用来维持服务器的租用成本,如果需要用到这个repo的数据,备注数据来源后直接引用就可以。
最后,如果未来建站,欢迎大家通过比对网站数据、查阅commit历史的方式监督数据的使用,这样可以杜绝因为利益问题删除部分评论的事情发生。