网站首页 > 基础教程 正文
今天我们来了解一个Excel中非常强大的功能:汇总PDF文件,相较于其他的汇总软件,利用Excel进行汇总最大的好处就是可以自动匹配表头,后期如果有新的文件进来只需点击下刷新就能一键汇总
一、所需函数
今天我们需要用到2个M函数,这个是PowerQuery独有的,Excel也是需要版本支持的,最低2016,如果版本不止的话,使用PowerBI也是一样的操作
Pdf.Tables:获取PDF文件中的表格
Table.PromoteHeaders:将第一行用于标题
M函数的用法与Excel函数很相似,但是它们的区别还是还是很大的,Excel函数仅仅只能计算单元格,M函数可以计算一个表格,一列数据的,简单来说就是它可以对表格的结构进行计算
二、导入到PowerQuery
首先我们需要将想要汇总的Excel都放在一个文件夹中,随后打开Excel,点击【数据】功能组,在右侧找到【获取数据】→【从文件夹】,然后找到存放PDF的文件夹,直接点击下打开,稍等一下就会看出一个【导航器】的界面,点击右下角的【转换数据】进入PowerQuery的编辑界面
三、数据整理
在这里我们仅仅需要【Content】与【Name】这两列数据,可以将所有的数据都删掉。
Content这一列我们可以理解为它就是一个PDF文件
Name这一列就是每个PFD文件的名称
随后点击【添加列】找到【自定义列】在跳出的窗口中输入函数:=Pdf.Tables([Content]),它的作用就是获取PDF中的表格中数据,点击确定后,就会多出一列【自定义】列,需要点击右上角的左右箭头来展开数据,仅仅勾选【Kind】与【Data】这两个字段即可,不要使用【原始列名作为前缀】
四、筛选数据
【Data】这个字段存放的就是PDF文件中的表格,【Kind】这个字段是数据类型。
首先在【Kind】中仅仅选中【Table】这个类型,就是表示仅仅选中PDF文件中的表格,【page】表示页,就是PDF每一页的数据,这个我们是不需要的
随后点击【Data】中蓝色的table就会看到表格,但是现在数据的表头是在表格中的,我们需要将表头放在上一行用做标题,才能使用自动匹配字段
筛选完毕后,就可以将【Kind】与【Content】这两个字段删掉了
五、提升标题
需要点击下【添加列】找到自定义列,将公式设置为:Table.PromoteHeaders([Data]),然后点击确定,就会在后面多出一个【自定义】列,这样的话就会将表头用作标题,我们还是直接点击【右上角】来展开数据即可,这样就可以将所有的PDF文件都汇总一起。
最后将【Data】这一列删除掉,然后点击【主页】点击【关闭并上载】就会将数据加载到Excel文件中了,至此就汇总完毕了
后期如果有新的PDF文件进来,只需要放在这个文件夹中,然后打开汇总表,点击【刷新】就能实现自动汇总了,非常的方便。
想要从零学习Excel,这里↓↓↓
猜你喜欢
- 2025-01-14 手机帝国存档怎么修改 存档简单修改教程
- 2025-01-14 文档在线预览(四) 总结篇
- 2025-01-14 MySQL数据库表碎片收集整理那些事
- 2025-01-14 刘心向学(8)指针数组的应用
- 2025-01-14 C#控件美化之路(11):控件ListBox增加DataTable数据绑定功能
- 2025-01-14 一文看懂MySQL如何判断InnoDB表是独立表空间还是共享表空间
- 2025-01-14 SpringBoot实现MySQL数据库自动备份管理系统
- 2025-01-14 一键生成数据库文档,从此告别人工整理文档
- 2025-01-14 all about visitor management system you need to know 03
- 2025-01-14 一篇文章教会你进行Mysql数据库和数据表的基本操作
- 05-162025前端最新面试题之HTML和CSS篇
- 05-16大数据开发基础之HTML基础知识
- 05-16微软专家告诉你Win10 Edge浏览器和EdgeHTML的区别
- 05-16快速免费将网站部署到公网方法(仅支持HTML,CSS,JS)
- 05-16《从零开始学前端:HTML+CSS+JavaScript的黄金三角》
- 05-16一个简单的标准 HTML 设计参考
- 05-16css入门
- 05-16前端-干货分享:更牛逼的CSS管理方法-层(CSS Layers)
- 最近发表
- 标签列表
-
- jsp (69)
- pythonlist (60)
- gitpush (78)
- gitreset (66)
- python字典 (67)
- dockercp (63)
- gitclone命令 (63)
- dockersave (62)
- linux命令大全 (65)
- pythonif (86)
- location.href (69)
- dockerexec (65)
- deletesql (62)
- c++模板 (62)
- linuxgzip (68)
- 字符串连接 (73)
- nginx配置文件详解 (61)
- html标签 (69)
- c++初始化列表 (64)
- mysqlinnodbmyisam区别 (63)
- arraylistadd (66)
- console.table (62)
- mysqldatesub函数 (63)
- window10java环境变量设置 (66)
- c++虚函数和纯虚函数的区别 (66)