纠正同一字段含有性质不同的值

IT部门的同事不时会扭曲数据使用者的意图,设计出不合理的数据布局,其中比较常见的不合理布局为同一字段含有性质不同的值。假如数据使用者需要如下图的数据:

不幸的是,IT部门的同事提供的的数据为:

如果IT部门的同事拒绝修改以上数据的布局,请使用以下的代码:

由于刘关张学习的[......]

阅读全文

餐厅星评排序

老王经过自己的下属小明时发现小明在办公时间玩手机,所以给他安排了为数据排序的工作。这份数据(DB)记录了10家评分机构对1000家餐厅的评价,最高的评价为5星,最低为1星。老王让小明根据每一家餐厅获得的总星数以行为单位进行升序排列,并且根据每一家评分机构给出的总星数以列为单位进行升序排列。

[......]

阅读全文

筛选异常值

题目:


要求从一堆零件中找出存在异常的零件。
比如第7行的27明显比其他值小很多,而第10行的3792明显比其他值大很多,都属于异常值。

解法:

要找出异常值,首先得定义异常的条件,异常到什么程度才能算作"异常"?
根据百度百科词条,在统计学中通常把与样本平均值相差2个标准差以上的[......]

阅读全文

套装组合问题

题目:

现有一张订单明细表,包含下单时间、订单编号以及商品SKU码,一笔订单可能会购买多件商品,所以一个订单编号对应一个或多个SKU码。
以及一张套装组合表,共有5种套装,每个套装包含若干个商品SKU。

若某笔订单下的商品能够构成套装,则认为该订单是卖出套装而产生。
要求每种套装卖出多少[......]

阅读全文