需求:小白是职场新人,负责在公司打印银行回单,从银行导出的回单都是PDF格式的文件,单据之多,让人望而却步(此处留下100个脚印);如果一次性全部打印,公司的打印机可能消化不了,可能会出现断档遗漏的情况,因此找到了兄弟帮忙。
分析:作为一个既动财务,还会python的老鸟,分分钟的搞定的事情嘛,用python脚本撸一遍,就可以把几百上千个PDF文件合并起来(记得某款软件也可以实现该功能),下面直接上代码。亲测过,没毛病。
---------------------------------------------------以下为python源码,仅供学习---------------------------------------------
import os
from PyPDF2 import PdfFileReader, PdfFileWriter, PdfFileMerger
import time
# 使用os模块的walk函数,搜索出指定目录下的全部PDF文件
# 获取同一目录下的所有PDF文件的绝对路径
def get_file_name(filedir):
file_list = [os.path.join(root, filespath) \
for root, dirs, files in os.walk(filedir) \
for filespath in files \
if str(filespath).endswith('pdf')
]
return file_list if file_list else []
# 合并同一目录下的所有PDF文件
def MergePDF(filepath, outfile):
output = PdfFileWriter()
outputPages = 0
pdf_fileName = get_file_name(filepath)
if pdf_fileName:
for pdf_file in pdf_fileName:
print("路径:%s"%pdf_file)
# 读取源PDF文件
input = PdfFileReader(open(pdf_file, "rb"))
# 获得源PDF文件中页面总数
pageCount = input.getNumPages()
outputPages += pageCount
print("页数:%d"%pageCount)
# 分别将page添加到输出output中
for iPage in range(pageCount):
output.addPage(input.getPage(iPage))
print("合并后的总页数:%d."%outputPages)
# 写入到目标PDF文件
outputStream = open(os.path.join(filepath, outfile), "wb")
output.write(outputStream)
outputStream.close()
print("PDF文件合并完成!")
else:
print("没有可以合并的PDF文件!")
def main():
file_dir = r'.\datasets' # 存放PDF的原文件夹
outfile = "Cheat_Sheets.pdf" # 输出的PDF文件的名称
MergePDF(file_dir, outfile)
if __name__ == '__main__':
main()
------------------------------------------------------------end--------------------------------------------------------------------
后续改进思路:
1、加上TK,方便小白的使用。
2、使用pyinstall转换成exe文件,方便windows用户运行。
上面仅仅是python的一个小小应用,未来可以考虑在财务机器人方面,做更多的事情。
本人财务脚本小子一枚,学习python一年多了,兴趣使然,可以搞点小项目和小应用,大神勿喷。