如何解决如何避免包含注释的.docx文件的MS-Word对话框在保存时暂停python执行?
问题:
我需要使用python将一些Word文件批处理为:
- 检查它们是否是.doc文件
- 如果要更改他们的名字
- 将它们另存为.docx文件
这样我就可以使用docx lib从文档中包含的表中提取一些信息。
尝试保存包含注释的docx文件时遇到问题,因为出现一个弹出窗口要求我确认是否要保存包含注释的文件。它会暂停执行代码,直到操作员通过在弹出窗口中单击“确定”手动确认。 这样可以防止在没有任何操作员输入的情况下自动运行代码。
注意:注释不需要保存在.docx文件中,因为我不会将其用于进一步的计算。
我做什么:
这是我现在拥有的代码,它将在执行结束之前停止,直到您用文字确认接受保留注释(以防您的doc文件包含某些注释):
import win32com.client
doc_file = "path\\of\\document.doc"
docx_file = "path\\of\\new_document.docx"
word = win32com.client.Dispatch("Word.application")
#get the file extension
file_extension = '.'+doc_file.split('\\').pop().split('.').pop()
#test file extension and convert it to docx if original document is a .doc
if file_extension.lower() == '.doc':
wordDoc = word.Documents.Open(doc_file,False,False)
wordDoc.SaveAs2(docx_file,FileFormat = 12)
wordDoc.Close()
#test file extension and print a message in the console if not a .doc document
else:
print('Extension of document {0} is not .doc,will not be treated'.format(doc_file))
word.Quit()
我尝试过的事情:
我试图寻找在保存之前删除注释的解决方案,因为以后我在创建的.docx文件中不使用它们,但是找不到令人满意的解决方案。
也许我只是使用了错误的方法,并且有一种超级简单的方法来关闭对话框或其他内容,但是以某种方式找不到它。
谢谢!
解决方法
这似乎可以解决问题,但是删除了所有注释:
import win32com.client
doc_file = "path\\of\\document.doc"
docx_file = "path\\of\\new_document.docx"
word = win32com.client.Dispatch("Word.application")
#get the file extension
file_extension = '.'+doc_file.split('\\').pop().split('.').pop()
#test file extension and convert it to docx if original document is a .doc
if file_extension.lower() == '.doc':
wordDoc = word.Documents.Open(doc_file,False,False)
# Accept all revisions
word.ActiveDocument.Revisions.AcceptAll()
# Delete all comments
if word.ActiveDocument.Comments.Count >= 1:
word.ActiveDocument.DeleteAllComments()
wordDoc.SaveAs2(docx_file,FileFormat = 12)
wordDoc.Close()
#test file extension and print a message in the console if not a .doc document
else:
print('Extension of document {0} is not .doc,will not be treated'.format(doc_file))
word.Quit()
我刚刚在下面添加了接受修改的部分,并删除了原始代码中的注释:
# Accept all revisions
word.ActiveDocument.Revisions.AcceptAll()
# Delete all comments
if word.ActiveDocument.Comments.Count >= 1:
word.ActiveDocument.DeleteAllComments()
我在这里找到了解决方法:Python - Using win32com.client to accept all changes in Word Documents
但是它仍然不能完全回答最初的问题。因为它消除了评论,因为在我自己的情况下,我不需要它们。但是,如果您需要评论,我仍然不知道如何进行。
,我今天偶然发现了这一点:
import win32com.client
doc_file = "path\\of\\document.doc"
docx_file = "path\\of\\new_document.docx"
word = win32com.client.Dispatch("Word.application")
#Disable save with comments warning
word.Options.WarnBeforeSavingPrintingSendingMarkup = False
#get the file extension
file_extension = '.'+doc_file.split('\\').pop().split('.').pop()
#test file extension and convert it to docx if original document is a .doc
if file_extension.lower() == '.doc':
wordDoc = word.Documents.Open(doc_file,False)
wordDoc.SaveAs2(docx_file,will not be treated'.format(doc_file))
word.Quit()
一个更简单的解决方案是使用Office安装中Winword.exe旁边的wordconv.exe
命令行如下:
wordconv.exe -oice -nme inputfilePath outputFilePath
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。