LOGO OA教程 ERP教程 模切知识交流 PMS教程 CRM教程 开发文档 其他文档  
 
网站管理员

【Python】一键搞定Word(doc/docx)与PDF文档批量转换(附源码和工具)

admin
2024年12月3日 10:21 本文热度 396

今天分享一下如何利用Python实现Word文件和PDF文件的相互转换,尤其是PDF批量转Word。文末有福利哦~

1. Word转PDF文档

Word转PDF很简单,这里提几种方法:

  • 最简单的就是打开Word文档,然后另存为时选择“PDF”格式即可。
  • 使用一些在线工具,比如:Smallpdf (https://smallpdf.com/word-to-pdf)。
  • 使用第三方软件,比如我平时一般用福昕阅读器看PDF文件,安装的时候就会在Word里多一个插件,可以用来转PDF。

但,如果是几十份、甚至几百份Word文件呢?上面这样转就太吃力了,得请出Python了。

1.1 Word批量转PDF

通过Python,可以很方便地将Word文档批量转换为PDF,具体代码如下:

def convert_word_to_pdf(directory):
   files = os.listdir(directory)
   word_files = [f for f in files if f.endswith(('.doc', '.docx'))]
   
   word = comtypes.client.CreateObject('Word.Application')
   word.Visible = False  
   
   # 遍历每个Word文档文件并转换为PDF
   for word_file in word_files:
       word_file_path = os.path.join(directory, word_file)
       pdf_file_path = os.path.splitext(word_file_path)[0] + '.pdf'
       
       try:
           doc = word.Documents.Open(word_file_path)
           doc.SaveAs(pdf_file_path, FileFormat=17)  # 17代表PDF格式
           doc.Close()
           print(f"Converted {word_file} to {os.path.basename(pdf_file_path)}")
       except Exception as e:
           print(f"Failed to convert {word_file}: {e}")
   
   word.Quit()

if __name__ == "__main__":
   current_directory = os.getcwd()
   convert_word_to_pdf(current_directory)

2. PDF转Word文档

对于单个文件,同样有在线工具可以实现,比如:https://smallpdf.com/pdf-to-word。但是对于批量的PDF文件,显然Python更胜一筹!

2.1 PDF批量转Word

对于PDF转Word,我们可以使用pdf2docx库,这个库提供了简便的PDF到Word转换功能,具体代码如下:

def convert_pdf_to_word(directory):
   files = os.listdir(directory)
   
   pdf_files = [f for f in files if f.endswith('.pdf')]
   
   for pdf_file in pdf_files:
       pdf_file_path = os.path.join(directory, pdf_file)
       word_file_path = os.path.splitext(pdf_file_path)[0] + '.docx'
       
       cv = Converter(pdf_file_path)
       cv.convert(word_file_path)
       cv.close()
       
       print(f"Converted {pdf_file} to {os.path.basename(word_file_path)}")

if __name__ == "__main__":
   current_directory = os.getcwd()
   convert_pdf_to_word(current_directory)

One more thing…

为了朋友们使用方便,我把上述两个功能分别打包成.exe文件了只要把该文件放到需要转换文件的同级目录,双击运行即可完成转换!

  • Word2PDF.exe:Word转PDF可执行工具
  • PDF2Word.exe:PDF转Word可执行工具
下载:地址1地址2

该文章在 2024/12/3 10:26:54 编辑过
关键字查询
相关文章
正在查询...
点晴ERP是一款针对中小制造业的专业生产管理软件系统,系统成熟度和易用性得到了国内大量中小企业的青睐。
点晴PMS码头管理系统主要针对港口码头集装箱与散货日常运作、调度、堆场、车队、财务费用、相关报表等业务管理,结合码头的业务特点,围绕调度、堆场作业而开发的。集技术的先进性、管理的有效性于一体,是物流码头及其他港口类企业的高效ERP管理信息系统。
点晴WMS仓储管理系统提供了货物产品管理,销售管理,采购管理,仓储管理,仓库管理,保质期管理,货位管理,库位管理,生产管理,WMS管理系统,标签打印,条形码,二维码管理,批号管理软件。
点晴免费OA是一款软件和通用服务都免费,不限功能、不限时间、不限用户的免费OA协同办公管理系统。
Copyright 2010-2024 ClickSun All Rights Reserved