Skip to content

Commit

Permalink
Update README.md
Browse files Browse the repository at this point in the history
  • Loading branch information
JeremySun1224 committed Oct 26, 2019
1 parent e148de1 commit f90eb3c
Showing 1 changed file with 10 additions and 9 deletions.
19 changes: 10 additions & 9 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,10 +1,11 @@
# 代码主要是对大数据集(5G以上)进行分句操作
## 代码包括如下:
#### 如何文件夹及子文件夹下的数据
#### 中英文里可能出现的所有特殊字符
#### 匹配各类网址及网页标签
#### 匹配希腊字母汉语拼音及繁体字等
#### 利用*PyLTP*模块进行分句
#### 去掉文本空行函数
#### 计时装饰器以及代码进度条
## 代码主要是对大数据集(5G以上)进行分句操作
#### 代码包括:
##### 如何批量读取文件夹及子文件夹下的数据
##### 如何将批量整合文件夹及子文件下的数据
##### 匹配中英文里可能出现的所有特殊字符
##### 匹配各类网址及网页标签
##### 匹配希腊字母汉语拼音及繁体字等
##### 利用*PyLTP*模块进行分句
##### 去掉文本空行函数
##### 计时装饰器以及代码进度条
**欢迎star和fork**

0 comments on commit f90eb3c

Please sign in to comment.