拯救大龄二次元文本分析 数据时间 2018.1.1到2022.2.9中午 仅包括原创微博投稿(即后续转发不算做在内,第二次投稿如果为新的原创微博则包括)的文本信息,不包括图像信息。 爬虫由https://github.com/dataabc/weiboSpider实现 分词采用结巴分词https://github.com/fxsjy/jieba