Skip to content

hamano0813/TagPDF

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

74 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TagPDF PDF标签工具

python PySide6 sqlalchemy pypinyin

介绍

通过SQLITE数据库给PDF文件打标签,方便后续检索。

构建

  • 要求系统中已经安装Python解释器,且Python的版本要求大于等于3.10
  • 双击build.bat即可构建,构建完成后会在dist文件夹中生成TagPDF文件夹。

下载

  • 免构建使用可以点击右侧Releases中的TagPDF.zip下载最新版本,解压后使用。

使用

  • 双击TagPDF.exe运行程序。
  • 通过左侧扫描添加子窗口选择需要扫描的文件夹,点击扫描选中路径按钮开始扫描PDF。
  • 扫描获得的PDF会在中间的子窗口中显示,已经跟踪路径的PDF会有底色高亮显示。
  • 选择中间子窗口中的PDF,右侧上方的子窗口可以预览PDF,右侧下方的子窗口可以编辑PDF的标签。
  • PDF根据公文处理的要求提供了五个属性,分别是(公文)标题(公文)文号发布(单位)(发文)年份标签
  • 五个属性都随着编辑框的输入而实时更新。
  • 其中标题为必填项目,如果标题为空,其他属性都无法写入,如果标题被删除,其他属性也会被删除,并取消对该PDF的跟踪。
  • 发布标签属性可以根据需求进行自定义输入,每次输入完成按回车即可形成发布标签,已经存在的发布标签会有输入提示。
  • 可以通过发布标签上自带的×按钮删除已标记的发布标签
  • 通过左侧过滤查询子窗口可以对已经跟踪的PDF进行过滤查询,查询结果会在中间的子窗口中显示。
  • 查询的条件为发布(单位)(发文)年份标签,可以单独使用,也可以组合使用。
  • 查询全部未选中的情况下,则会列示所有已经跟踪的PDF。
  • 通过左侧过滤查询子窗口下方的过滤文本框可以实现模糊查询,输入关键字后自动过滤查询结果。
  • 关键字查询支持标题文号发布年份标签五个属性,支持全字符匹配、全拼音匹配、首字母匹配。
  • 中间的子窗口会列出当前扫描到的或者查询到的PDF,支持点击标题列进行排序,点击左上角的按钮可以恢复默认排序。
  • 通过导出当前列表按钮可以将当前列出的全部PDF打包成一个ZIP文件,方便传输,默认会将文件按年份进行归类。
  • 导出当前列表会弹出保存路径,选择待导出的文件夹路径即可,会同步生成当前导出的PDF的信息为csv文件。
  • 使用快捷键Ctrl+F会弹出批量更名的提问框,可将所有已经跟踪的PDF文件更名为标题

说明

  • 本程序使用了PySide6作为GUI框架,sqlalchemy作为数据库框架。
  • 本程序会在运行中产生一个pdf.db3文件,该文件为数据库文件,不建议手动更改或编辑。