同读取zip一样,使用二进制数据流解析docx文件,然后替换表格元素为html格式,最后用Web.Page
解析网页。
核心代码源自于KenR,我修改简化了部分代码并封装为自定义函数。
由于过程过于复杂不作解释,你也不需要去理解是什么意思,需要用时调用自定义函数即可。
比如桌面上有个docx[......]
国内首个M语言分享博客
将简写的发票号展开,如下图:
先直接上代码:
let 源 = Excel.CurrentWorkbook(){[Name="发票号"]}[Content], 构建list = Table.AddColumn(源, "展开", each [[......]
现有一张订单明细表,包含下单时间、订单编号以及商品SKU码,一笔订单可能会购买多件商品,所以一个订单编号对应一个或多个SKU码。
以及一张套装组合表,共有5种套装,每个套装包含若干个商品SKU。
若某笔订单下的商品能够构成套装,则认为该订单是卖出套装而产生。
要求每种套装卖出多少[......]
我用Power Query调用图灵机器人api做了一个机器人,很有意思,大家可以先下载附件体验下。
只要输入问题,机器人便会回答你,像小黄鸡一样。
至于怎么做的先不管,这不是本文的主题。但在使用的过程中很容易发现一个不太方便的地方:每输入一次问题,需要手动点击刷新才能看到机器人的回复,而不会[......]
在某些方面强大的同时,在其他方面必然存在一些不足,任何语言都不例外。
比如进行大位数运算,在Excel和Power Query中的数字都有位数限制,100的阶乘,是一个很大的数字了,直接算的话就会变成科学记数法,得不到精确的结果。
而在Python中是没有这个限制的,所以Power Quer[......]
我们知道Power Query能够连接很多不同格式的数据源,但同时还有很多是不能直接支持的,比如word文档、压缩包等等。
有这样一种场景:源数据来自于网络或者远程服务器,每天更新,文件格式是zip,压缩包内有csv。
如果不能直接读取zip,那么我们需要每天把zip下载下来,解压后再导入Pow[......]
即分箱问题,每10岁划分为一个年龄段,统计各分段的人数。
看到题目第一反应可能就想到分组,但是表里原来没有分组的依据列,所以只需要添加一个年龄段的列,再根据这一列分组就可以了。分组完顺序是乱的,最后再加个排序。
let 源 = Excel.Curren[......]
首先Power Query并不是一个专门的网抓或者爬虫工具,没有编程语言那么专业,实现的功能也比较有限,但其优势就是简单易学,且无缝对接excel,所见即所得。
网上关于网抓的资料有很多,但没有用PQ实现的,之前写过一篇《Power Query网抓案例》,今天来详细讲讲。
本文将以纯新手的角度,[......]
在目前可选的数据展现方案中,Power BI效果更加酷炫,逼格更高,而Excel则更加灵活且普及度更高,很难取舍,所以很多人都会选择两者各做一个版本。
但多版本必然会带来一些麻烦,比如要对模型作一次改动,需要两边都改一下,而且每天刷新数据都要刷新两次。
如果你经常在Excel中使用Power P[......]
现一个文件夹下有N张如上图所示格式统一的档案表,需要汇总得到如下图的一维表。
遇到这种多维度又有合并单元格的表格,什么透视逆透视的都已经没用了,仅靠转换表是不可能得到想要的一维数据的。
我们的需求是对于每张表获取一行标题和一行数据,又因为每张表格式统一,所以每一个[......]