Python办公自动化 学习反馈TASK1
使用语言:python
Tas1 – Task5
Task4
题目理解:
本次学习主要针对办公过程中的python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取。
Task04—PDF主要是以下几个点:
- 基于多个外接库进行处理
- 初级的 PDF 自动化包括 PDF 文档的拆分、合并、提取等操作,更高级的还包括 WORD与PDF互转等
-个人题会
这次的task明显比之前的两种难了好多,但是实用性会更强
特别是在PDF 文档的拆分、合并、提取等常规操作方面
其中,体会最深的、平常最常用的:
1.批量拆分
将一个完整的PDF拆分成几个小的PDF,使用PyPDF2库
拆分思路:
读取PDF的整体信息、总页数
遍历每一页的内容、以每个step为间隔将PDF存成每一个小的文件块。【可以手动设置间隔,例如:每5页保存一个小的PDF文件】
将小的文件块重新保存为新的PDF文件
2.批量合并
合并思路:
确定要合并的文件顺序
循环追加到一个文件块中
保存为一个新文件
- 接下来需要进行学习的:
-
- 表格提取
-
- 图片提取
-
- 解密PDF
原文链接:https://blog.csdn.net/lolin99/article/details/118163233