专业编程基础技术教程

网站首页 > 基础教程 正文

python实现pdf转word(python如何把pdf转成excel)

ccvgpt 2024-11-15 16:43:52 基础教程 8 ℃

有时我们有将pdf转为word的需求,但许多软件都是付费的。python有一个pdf2docx库,使用它可以将pdf转为docx。

要注意的是,这种方案对部分文件效果不好,有排版混乱的问题,效果有时赶不上付费软件,但免费的还要啥自行车啊[狗头]

python实现pdf转word(python如何把pdf转成excel)

代码:

import multiprocessing
from pdf2docx import Converter

def func(a):
    pdf_file = a
    docx_file = pdf_file.rsplit('.',1)[0] + '.docx'
    
    cv = Converter(pdf_file)
    cv.convert(docx_file, multi_processing=True, cpu_count=4)
    cv.close()
    
if __name__ == "__main__":
    # 启用多线程支持提高转换速度
    multiprocessing.freeze_support()
    x=input().strip('"')
    func(x)

用法:

  • 安装python环境;
  • pdf2docx库需要额外安装:
pip install pdf2docx
  • 将cpu_count的值改为你电脑CPU的线程数;
  • 将代码保存为py文件,如pdf.py;
  • 运行
python pdf.py
  • 粘贴pdf文件路径(在资源管理器中按住Shift键,鼠标右键单击要转换的pdf文件,选择“复制文件地址”,在控制台中右键粘贴),回车运行,待代码跑完后即转换完成,得到的docx文件在pdf文件所在的路径中。

--End--

Tags:

最近发表
标签列表