读取Word文档中的表格

同读取zip一样,使用二进制数据流解析docx文件,然后替换表格元素为html格式,最后用Web.Page解析网页。
核心代码源自于KenR,我修改简化了部分代码并封装为自定义函数。
由于过程过于复杂不作解释,你也不需要去理解是什么意思,需要用时调用自定义函数即可。

比如桌面上有个docx[......]

阅读全文

套装组合问题

题目:

现有一张订单明细表,包含下单时间、订单编号以及商品SKU码,一笔订单可能会购买多件商品,所以一个订单编号对应一个或多个SKU码。
以及一张套装组合表,共有5种套装,每个套装包含若干个商品SKU。

若某笔订单下的商品能够构成套装,则认为该订单是卖出套装而产生。
要求每种套装卖出多少[......]

阅读全文

VBA自动刷新

我用Power Query调用图灵机器人api做了一个机器人,很有意思,大家可以先下载附件体验下。
只要输入问题,机器人便会回答你,像小黄鸡一样。

至于怎么做的先不管,这不是本文的主题。但在使用的过程中很容易发现一个不太方便的地方:每输入一次问题,需要手动点击刷新才能看到机器人的回复,而不会[......]

阅读全文

不解压直接读取zip压缩包

我们知道Power Query能够连接很多不同格式的数据源,但同时还有很多是不能直接支持的,比如word文档、压缩包等等。
有这样一种场景:源数据来自于网络或者远程服务器,每天更新,文件格式是zip,压缩包内有csv。
如果不能直接读取zip,那么我们需要每天把zip下载下来,解压后再导入Pow[......]

阅读全文

Power Query网抓详解

首先Power Query并不是一个专门的网抓或者爬虫工具,没有编程语言那么专业,实现的功能也比较有限,但其优势就是简单易学,且无缝对接excel,所见即所得。
网上关于网抓的资料有很多,但没有用PQ实现的,之前写过一篇《Power Query网抓案例》,今天来详细讲讲。
本文将以纯新手的角度,[......]

阅读全文

使用Excel连接Power BI模型

在目前可选的数据展现方案中,Power BI效果更加酷炫,逼格更高,而Excel则更加灵活且普及度更高,很难取舍,所以很多人都会选择两者各做一个版本。
但多版本必然会带来一些麻烦,比如要对模型作一次改动,需要两边都改一下,而且每天刷新数据都要刷新两次。
如果你经常在Excel中使用Power P[......]

阅读全文

多维转一维

题目:


现一个文件夹下有N张如上图所示格式统一的档案表,需要汇总得到如下图的一维表。

解法:

遇到这种多维度又有合并单元格的表格,什么透视逆透视的都已经没用了,仅靠转换表是不可能得到想要的一维数据的。
我们的需求是对于每张表获取一行标题和一行数据,又因为每张表格式统一,所以每一个[......]

阅读全文