Datawhale | Python办公自动化 Task04

Python办公自动化 学习反馈TASK1

使用语言:python

Tas1 – Task5

Task4

题目理解:

本次学习主要针对办公过程中的python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取。

Task04—PDF主要是以下几个点:
  • 基于多个外接库进行处理
  • 初级的 PDF 自动化包括 PDF 文档的拆分、合并、提取等操作,更高级的还包括 WORD与PDF互转等

-个人题会
这次的task明显比之前的两种难了好多,但是实用性会更强
特别是在PDF 文档的拆分、合并、提取等常规操作方面
其中,体会最深的、平常最常用的:
1.批量拆分

将一个完整的PDF拆分成几个小的PDF,使用PyPDF2库
拆分思路:
读取PDF的整体信息、总页数
遍历每一页的内容、以每个step为间隔将PDF存成每一个小的文件块。【可以手动设置间隔,例如:每5页保存一个小的PDF文件】
将小的文件块重新保存为新的PDF文件

2.批量合并

合并思路:
确定要合并的文件顺序
循环追加到一个文件块中
保存为一个新文件
  • 接下来需要进行学习的:
    • 表格提取
    • 图片提取
    • 解密PDF

更多相关推荐

Datawhale | Python办公自动化 T...

Python办公自动化学习反馈TASK1使用语言:pythonTas1–Task5Task3题目理解:本次学习主要针对办...

继续阅读

task04 办公自动化之Python 操作...

1、相关库了解利用python操作pdf会用到两个库,分别是:PyPDF2和pdfplumber其中PyPDF2可以读取...

继续阅读

Datawhale | Python办公自动化

Python办公自动化学习反馈TASK1使用语言:pythonTas1–Task5Task1题目理解:本次学习主要针对办...

继续阅读

Datawhale | Python办公自动化02

Python办公自动化学习反馈TASK2使用语言:pythonTas1–Task5Task2题目理解:本次学习主要针对办...

继续阅读

DataWhale Python办公自动化Task...

1.1文件目录和路径文件的两个属性,路径和文件名Python中的文件路径和目录的相关包主要是os,...

继续阅读

Datawhale | Python办公自动化05...

Python办公自动化学习反馈TASK5使用语言:pythonTas1–Task5Task5题目理解:本次学习主要针对办...

继续阅读

Python办公自动化 | Task 04 Pyt...

1.安装库2.拆分PDF将一个PDF拆分成几个PDF//可太方便了,再也不用花钱拆分PDF了3.合并PDF将几...

继续阅读

【python办公自动化】task 04 py...

目录1.预备知识2.批量拆分3.批量合并1.预备知识Python操作pdf会用到两个库:PyPDF2可以更好的...

继续阅读

Python办公自动化task2

一个Excel电子表格文档称为一个工作簿。一个工作簿保存在扩展名为.xlsx的文件中。每个工作簿可...

继续阅读

办公自动化打卡 task01

本次学习内容均来自DataWhale第26期组队学习https://github.com/datawhalechina/team-learning...

继续阅读