专业编程基础技术教程

网站首页 > 基础教程 正文

python系列1:教你一键合并成百上千个PDF文件

ccvgpt 2024-08-09 12:04:15 基础教程 9 ℃

需求:小白是职场新人,负责在公司打印银行回单,从银行导出的回单都是PDF格式的文件,单据之多,让人望而却步(此处留下100个脚印);如果一次性全部打印,公司的打印机可能消化不了,可能会出现断档遗漏的情况,因此找到了兄弟帮忙。

分析:作为一个既动财务,还会python的老鸟,分分钟的搞定的事情嘛,用python脚本撸一遍,就可以把几百上千个PDF文件合并起来(记得某款软件也可以实现该功能),下面直接上代码。亲测过,没毛病。

python系列1:教你一键合并成百上千个PDF文件

---------------------------------------------------以下为python源码,仅供学习---------------------------------------------

import os

from PyPDF2 import PdfFileReader, PdfFileWriter, PdfFileMerger

import time

# 使用os模块的walk函数,搜索出指定目录下的全部PDF文件

# 获取同一目录下的所有PDF文件的绝对路径

def get_file_name(filedir):

file_list = [os.path.join(root, filespath) \

for root, dirs, files in os.walk(filedir) \

for filespath in files \

if str(filespath).endswith('pdf')

]

return file_list if file_list else []


# 合并同一目录下的所有PDF文件

def MergePDF(filepath, outfile):

output = PdfFileWriter()

outputPages = 0

pdf_fileName = get_file_name(filepath)

if pdf_fileName:

for pdf_file in pdf_fileName:

print("路径:%s"%pdf_file)

# 读取源PDF文件

input = PdfFileReader(open(pdf_file, "rb"))

# 获得源PDF文件中页面总数

pageCount = input.getNumPages()

outputPages += pageCount

print("页数:%d"%pageCount)

# 分别将page添加到输出output中

for iPage in range(pageCount):

output.addPage(input.getPage(iPage))

print("合并后的总页数:%d."%outputPages)

# 写入到目标PDF文件

outputStream = open(os.path.join(filepath, outfile), "wb")

output.write(outputStream)

outputStream.close()

print("PDF文件合并完成!")

else:

print("没有可以合并的PDF文件!")

def main():

file_dir = r'.\datasets' # 存放PDF的原文件夹

outfile = "Cheat_Sheets.pdf" # 输出的PDF文件的名称

MergePDF(file_dir, outfile)

if __name__ == '__main__':

main()

------------------------------------------------------------end--------------------------------------------------------------------

后续改进思路:

1、加上TK,方便小白的使用。

2、使用pyinstall转换成exe文件,方便windows用户运行。

上面仅仅是python的一个小小应用,未来可以考虑在财务机器人方面,做更多的事情。

本人财务脚本小子一枚,学习python一年多了,兴趣使然,可以搞点小项目和小应用,大神勿喷。

最近发表
标签列表