generated from obsidianmd/obsidian-sample-plugin
-
Notifications
You must be signed in to change notification settings - Fork 7
/
formatUtil.ts
179 lines (151 loc) · 8.39 KB
/
formatUtil.ts
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
export default {
condenseContent(content: string): string {
// 将 制表符 改成 四个空格
content = content.replace(/\t/g, ' ');
// 删除超过2个的回车
// Unix 的只有 LF,Windows 的需要 CR LF
content = content.replace(/(\n){3,}/g, '$1$1');
content = content.replace(/(\r\n){3,}/g, '$1$1');
return content;
},
deleteSpaces(content: string): string {
// 去掉「`()[]{}<>'"`」: 前后多余的空格
content = content.replace(/\s+([\(\)\[\]\{\}<>'":])\s+/g, ' $1 ');
// 去掉连续括号增加的空格,例如:「` ( [ { < > } ] ) `」
content = content.replace(/([<\(\{\[])\s([<\(\{\[])\s/g, '$1$2 ');
content = content.replace(/([<\(\{\[])\s([<\(\{\[])\s/g, '$1$2 ');
content = content.replace(/([<\(\{\[])\s([<\(\{\[])\s/g, '$1$2 ');
content = content.replace(/([<\(\{\[])\s([<\(\{\[])\s/g, '$1$2 ');
content = content.replace(/\s([>\)\]\}])\s([>\)\]\}])/g, ' $1$2');
content = content.replace(/\s([>\)\]\}])\s([>\)\]\}])/g, ' $1$2');
content = content.replace(/\s([>\)\]\}])\s([>\)\]\}])/g, ' $1$2');
content = content.replace(/\s([>\)\]\}])\s([>\)\]\}])/g, ' $1$2');
// 去掉 「`$ () $`」, 「`$ [] $`」, 「`$ {} $`」 里面增加的空格
// 去掉开始 $ 后面增加的空格,结束 $ 前面增加的空格
// 去掉包裹代码的符号里面增加的空格
// 去掉开始 ` 后面增加的空格,结束 ` 前面增加的空格
content = content.replace(/([`\$])\s*([<\(\[\{])([^\$]*)\s*([`\$])/g, '$1$2$3$4');
content = content.replace(/([`\$])\s*([^\$]*)([>\)\]\}])\s*([`\$])/g, '$1$2$3$4');
// 去掉「`) _`」、「`) ^`」增加的空格
content = content.replace(/\)\s([_\^])/g, ')$1');
// 去掉 [^footnote,2002] 中的空格
content = content.replace(/\[\s*\^([^\]\s]*)\s*\]/g, '[^$1]');
// 将链接的格式中文括号“[]()”改成英文括号“[]()”,去掉增加的空格
content = content.replace(/\s*\[\s*([^\]]+)\s*\]\s*[((]\s*([^\s\)]*)\s*[))]\s*/g, ' [$1]($2) ');
// 将图片链接的格式中的多余空格“! []()”去掉,变成“![]()”
content = content.replace(/!\s*\[\s*([^\]]+)\s*\]\s*[((]\s*([^\s\)]*)\s*[))]\s*/g, '![$1]($2) ');
// 将网络地址中“ : // ”符号改成“:https://”
content = content.replace(/\s*:\s*\/\s*\/\s*/g, ':https://');
// 去掉行末空格
content = content.replace(/(\S*)\s*$/g, '$1');
// 去掉「123 °」和 「15 %」中的空格
content = content.replace(/([0-9])\s*([°%])/g, '$1$2');
// 去掉 2020 - 04 - 20, 08 : 00 : 00 这种日期时间表示的数字内的空格
content = content.replace(/([0-9])\s*-\s*([0-9])/g, '$1-$2');
content = content.replace(/([0-9])\s*:\s*([0-9])/g, '$1:$2');
// 去掉 1 , 234 , 567 这种千分位表示的数字内的空格
content = content.replace(/([0-9])\s*,\s*([0-9])/g, '$1,$2');
// 全角標點與其他字符之間不加空格
// 将无序列表的-后面的空格保留
// 将有序列表的-后面的空格保留
content = content.replace(/^(?<![-|\d.]\s*)\s*([,。、《》?『』「」;∶【】{}—!@¥%…()])\s*/g, '$1');
return content;
},
insertSpace(content: string): string {
// 在 “中文English” 之间加入空格 “中文 English”
// 在 “中文123” 之间加入空格 “中文 123”
content = content.replace(/([\u4e00-\u9fa5\u3040-\u30FF])([a-zA-Z0-9`])/g, '$1 $2');
// 在 “English中文” 之间加入空格 “English 中文”
// 在 “123中文” 之间加入空格 “123 中文”
content = content.replace(/([a-zA-Z0-9%`])([*]*[\u4e00-\u9fa5\u3040-\u30FF])/g, '$1 $2');
// 在 「I said:it's a good news」的冒号与英文之间加入空格 「I said: it's a good news」
content = content.replace(/([:])\s*([a-zA-z])/g, '$1 $2');
return content;
},
replacePunctuations(content: string): string {
// `, \ . : ; ? !` 改成 `,、。:;?!`
// 必须在结尾或者有空格的点才被改成句号
content = content.replace(/([\u4e00-\u9fa5\u3040-\u30FF])\.($|\s*)/g, '$1。');
content = content.replace(/([\u4e00-\u9fa5\u3040-\u30FF]),/g, '$1,');
content = content.replace(/([\u4e00-\u9fa5\u3040-\u30FF]);/g, '$1;');
content = content.replace(/([\u4e00-\u9fa5\u3040-\u30FF])!/g, '$1!');
content = content.replace(/([\u4e00-\u9fa5\u3040-\u30FF])\?/g, '$1?');
content = content.replace(/([\u4e00-\u9fa5\u3040-\u30FF])\\/g, '$1、');
content = content.replace(/([\u4e00-\u9fa5\u3040-\u30FF])\s*\:/g, '$1:');
// 簡體中文使用直角引號
content = content.replace(/‘/g, '『');
content = content.replace(/’/g, '』');
content = content.replace(/“/g, '「');
content = content.replace(/”/g, '」');
// 括号使用半角标点
// 半角括号的两边都有空格就不在这里处理了,放到行中处理
content = content.replace(/\s*[((]\s*/g, ' ( ');
content = content.replace(/\s*[))]\s*/g, ' ) ');
// 英文和数字内部的全角标点 `,。;‘’“”:?!@#%&-=+{}【】|\~`改成半角标点
content = content.replace(/(\w)\s*,\s*(\w)/g, '$1, $2');
content = content.replace(/(\w)\s*。\s*(\w)/g, '$1. $2');
content = content.replace(/(\w)\s*;\s*(\w)/g, '$1; $2');
content = content.replace(/(\w)\s*‘\s*(\w)/g, "$1 '$2");
content = content.replace(/(\w)\s*’\s*(\w)/g, "$1' $2");
content = content.replace(/(\w)\s*“\s*(\w)/g, '$1 "$2');
content = content.replace(/(\w)\s*”\s*(\w)/g, '$1" $2');
content = content.replace(/(\w)\s*:\s*(\w)/g, '$1: $2');
content = content.replace(/(\w)\s*?\s*(\w)/g, '$1? $2');
content = content.replace(/(\w)\s*!\s*(\w)/g, '$1! $2');
content = content.replace(/(\w)\s*@\s*(\w)/g, '$1@$2');
content = content.replace(/(\w)\s*#\s*(\w)/g, '$1#$2');
content = content.replace(/(\w)\s*%\s*(\w)/g, '$1 % $2');
content = content.replace(/(\w)\s*&\s*(\w)/g, '$1 & $2');
content = content.replace(/(\w)\s*-\s*(\w)/g, '$1 - $2');
content = content.replace(/(\w)\s*=\s*(\w)/g, '$1 = $2');
content = content.replace(/(\w)\s*+\s*(\w)/g, '$1 + $2');
content = content.replace(/(\w)\s*{\s*(\w)/g, '$1 {$2');
content = content.replace(/(\w)\s*}\s*(\w)/g, '$1} $2');
content = content.replace(/(\w)\s*[【\[]\s*(\w)/g, '$1 [$2');
content = content.replace(/(\w)\s*[】\]]\s*(\w)/g, '$1] $2');
content = content.replace(/(\w)\s*|\s*(\w)/g, '$1 | $2');
content = content.replace(/(\w)\s*\\s*(\w)/g, '$1 $2');
content = content.replace(/(\w)\s*~\s*(\w)/g, '$1~$2');
// 连续三个以上的 `。` 改成 `......`
content = content.replace(/[。]{3,}/g, '……');
// 截断连续超过一个的 ?和! 为一个,「!?」也算一个
content = content.replace(/([!?]+)\1{1,}/g, '$1');
// 截断连续超过一个的 。,;:、“”『』〖〗《》 为一个
content = content.replace(/([。,;:、“”『』〖〗《》【】])\1{1,}/g, '$1');
return content;
},
replaceFullNumbersAndChars(content: string): string {
// 替换全角数字 & 全角英文
// A -> A
// 0 -> 0
return content.replace(/[\uFF10-\uFF19\uFF21-\uFF5A]/g, c => String.fromCharCode(c.charCodeAt(0) - 0xfee0));
},
formatContent(content: string): string {
// 替换所有的全角数字和字母为半角
content = this.replaceFullNumbersAndChars(content);
// 删除多余的内容(回车)
content = this.condenseContent(content);
// 每行操作
content = content
.split('\n')
.map((line: string) => {
// 中文内部使用全角标点
// line = formatUtil.replacePunctuations(line);
// 删除多余的空格
line = this.deleteSpaces(line);
// 插入必要的空格
line = this.insertSpace(line);
// 将有编号列表的“1. ”改成 “1. ”
line = line.replace(/^(\s*)(\d\.)\s+(\S)/, '$1$2 $3');
// 将无编号列表的“* ”改成 “- ”
// 将无编号列表的“- ”改成 “- ”
line = line.replace(/^(\s*)[-\*]\s+(\S)/, '$1- $2');
return line;
})
.join('\n');
// 结束文档整理前再删除最后一个回车
content = content.replace(/(\n){2,}$/g, '$1');
content = content.replace(/(\r\n){2,}$/g, '$1');
return content;
},
};