M套路108式 – 第 4 页 – Power Query爱好者

读取Word文档中的表格

施阳 / 2017年12月5日2018年6月3日 / 困难

同读取zip一样，使用二进制数据流解析docx文件，然后替换表格元素为html格式，最后用Web.Page解析网页。
核心代码源自于KenR，我修改简化了部分代码并封装为自定义函数。
由于过程过于复杂不作解释，你也不需要去理解是什么意思，需要用时调用自定义函数即可。

比如桌面上有个docx[......]

阅读全文

发票号展开

施阳 / 2017年11月29日2017年12月1日 / 普通

题目：

将简写的发票号展开，如下图：

解法：

先直接上代码：

let
    源 = Excel.CurrentWorkbook(){[Name="发票号"]}[Content],
    构建list = Table.AddColumn(源, "展开", each [[......]阅读全文

套装组合问题

施阳 / 2017年11月23日2017年11月23日 / 普通

题目：

现有一张订单明细表，包含下单时间、订单编号以及商品SKU码，一笔订单可能会购买多件商品，所以一个订单编号对应一个或多个SKU码。
以及一张套装组合表，共有5种套装，每个套装包含若干个商品SKU。

若某笔订单下的商品能够构成套装，则认为该订单是卖出套装而产生。
要求每种套装卖出多少[......]

阅读全文

VBA自动刷新

施阳 / 2017年11月6日2017年11月6日 / 普通

我用Power Query调用图灵机器人api做了一个机器人，很有意思，大家可以先下载附件体验下。
只要输入问题，机器人便会回答你，像小黄鸡一样。

至于怎么做的先不管，这不是本文的主题。但在使用的过程中很容易发现一个不太方便的地方：每输入一次问题，需要手动点击刷新才能看到机器人的回复，而不会[......]

阅读全文

M与Python交互

施阳 / 2017年11月6日2017年12月11日 / 困难

在某些方面强大的同时，在其他方面必然存在一些不足，任何语言都不例外。
比如进行大位数运算，在Excel和Power Query中的数字都有位数限制，100的阶乘，是一个很大的数字了，直接算的话就会变成科学记数法，得不到精确的结果。

而在Python中是没有这个限制的，所以Power Quer[......]

阅读全文

不解压直接读取zip压缩包

施阳 / 2017年10月31日2018年6月3日 / 困难

我们知道Power Query能够连接很多不同格式的数据源，但同时还有很多是不能直接支持的，比如word文档、压缩包等等。
有这样一种场景：源数据来自于网络或者远程服务器，每天更新，文件格式是zip，压缩包内有csv。
如果不能直接读取zip，那么我们需要每天把zip下载下来，解压后再导入Pow[......]

阅读全文

分段频次分布统计

施阳 / 2017年10月25日2017年11月2日 / 普通

题目：

即分箱问题，每10岁划分为一个年龄段，统计各分段的人数。

解法1：

看到题目第一反应可能就想到分组，但是表里原来没有分组的依据列，所以只需要添加一个年龄段的列，再根据这一列分组就可以了。分组完顺序是乱的，最后再加个排序。

let
    源 = Excel.Curren[......]阅读全文

Power Query网抓详解

施阳 / 2017年10月16日2018年1月8日 / 困难

首先Power Query并不是一个专门的网抓或者爬虫工具，没有编程语言那么专业，实现的功能也比较有限，但其优势就是简单易学，且无缝对接excel，所见即所得。
网上关于网抓的资料有很多，但没有用PQ实现的，之前写过一篇《Power Query网抓案例》，今天来详细讲讲。
本文将以纯新手的角度，[......]

阅读全文

使用Excel连接Power BI模型

施阳 / 2017年9月18日2017年9月20日 / 普通

在目前可选的数据展现方案中，Power BI效果更加酷炫，逼格更高，而Excel则更加灵活且普及度更高，很难取舍，所以很多人都会选择两者各做一个版本。
但多版本必然会带来一些麻烦，比如要对模型作一次改动，需要两边都改一下，而且每天刷新数据都要刷新两次。
如果你经常在Excel中使用Power P[......]

阅读全文