首页 >> 实验教学 >> 实验项目 >> 详细内容

实验教学

实验项目 >> 正文

Power BI数据分析与可视化

日期：2021-12-09 17:15:32 发布人：nclgjsj 浏览量：1022

实验一、获取数据（选做）

一、 实验目的

掌握获取excel数据
掌握获取webl数据

二、 实验内容

利用power bi获取数据

三、 实验环境

（1） Windows7操作系统

（2） Power Bi Desktop

四、 实验步骤

1. 获取Excel数据

（1）在“开始”选项卡的“外部数据”组中，依次单击“获取数据”“Excel。

（2）在本机上找到“客户信息表.xlsx”文件，并选中后，单击“打开”按钮。

（3）在弹出的“导航器”对话框中，勾选“显示选项”中的“客户信息表”，单击“加载”按钮，如下图所示。

（4）此时回到报表视图，在“字段”窗格就出现“客户信息表”

2. 获取Web数据

（1）在“开始”选项卡的“外部数据”组中，依次单击“获取数据”“Web”命令，

（2）在弹出的“从Web”对话框中，勾选“基本”单选框，“URL”中填写本网页的网址，完成后单击“确定”按钮。

（3） 使用M语言获取网络分页数据，截取部分图片，具体需要上机练习。

五、 实验心得

通过实现，完成了web分页数据和多页数据的获取。

实验二、成绩表的数据清洗和客户年龄泛化

一、实验目的

（1）掌握成绩表的数据清洗

（2）掌握客户年龄泛化

二、实验内容

成绩表的数据清洗

客户年龄泛化

三、实验环境

Windows7操作系统

Power Bi Desktop

四、实验步骤

1. 数据清洗：Data cleaning

是在数据分析前对原始数据进行重新审查和校验的过程，目的在于清洗脏数据和降低数据维度，从而改善数据的质量和提高数据质量。

数据清洗对数据进行重新审查和校验的过程，目的在于删除重复信息、纠正存在的错误，并提供数据一致性。

2. 脏数据一般指3类数据：不完整数据，含噪声数据和不一致数据

不完整数据是指待分析的字段缺少数值，或仅包含聚集数据而没有具体数据。

噪声数据是指数据中存在着错误或异常(偏离期望值)的数据，这些数据对数据的分析造成了干扰。含噪声数据指包含错误或存在偏离期望的孤立点值。

不一致数据是指同一事物在不同表的表述不一致，一般是人为的命名或数据代码不一致而造成的。

3. 实现成绩表的数据清洗

Ø 利用Power Query清洗下表所示的成绩表（仅显示前10条数据）的脏数据，最终得到的效果如下图所示。（具体步骤电脑上练习）

4. 实现客户年龄泛化

存放在数据集的年龄数据是以下表的出生日期来存放，而在数据分析时却要显示为年龄的形式。因此需要对“年龄”字段进行泛化。

（1）获取“出生日期”字段的数据。

（2）将当前日期与“出生日期”字段的相减，结果向下取整获得“年龄”字段。

（3）根据一定的业务规则将“年龄”字段分组成“年龄分组”字段，如“少年”“青年”“中年”和“老年”等。（具体步骤电脑上练习）

五、 实验心得

通过实现，完成了成绩表的数据清洗和客户年龄泛化

实验三、新建度量值的练习

一、实验目的

1.掌握DIVIDE等函数计算客单价

2.掌握ALL函数求各销售单品占总销售额的比例

3.其实函数的使用

二、实验内容

1.掌握DIVIDE等函数计算客单价

2.掌握ALL函数求各销售单品占总销售额的比例

三、实验环境

Windows7操作系统

Power Bi Desktop

四、实验步骤

1. DAX语言是一种新的公式语言，允许用户在Power BI表中的“表”、“计算列”和“度量值”中定义自定义计算。DAX语言可通过模型中已有的数据创建和处理新信息。

2. DAX语言主要包含3个部分：

语法（Syntax），

函数（Functions），

上下文（Context）。

3. 新建度量值

在Power BI中，度量值是存放在一定的筛选条件下对数据源进行聚合运算结果的单个数据。通过新建度量值，存放商业逻辑上的一些需要通过一定运算得出的数值，如任务额或者销售额等，然后使用“可视化”窗格中的可视化图表对度量值进行可视化展示。度量值主要用于聚合计算时使用，运算过程在查询时才执行，并不占用内存。

新建总任务额度量值。右键单击“字段”窗格中的“项目组任务表”，选择“新建度量值”命令，在公式栏中输入表达式：总任务额 = SUM('项目组任务表'[任务额])。该表达式的作用是对某列中的所有数字求和，里面的参数是求和的列名。

如：

4. 使用DIVIDE等函数计算客单价

Ø DIVIDE函数的作用是返回安全除法的结果，其表达式如下。

DIVIDE(numerator, denominator,alternate_result)

Ø 其中，第一个参数是被除数，第二个参数是除数，第3个参数可填可不填，是遇到除零错误时返回的数值。例如=DIVIDE(25/0,9999)，返回结果为9999；=DIVIDE(6,2)返回结果为3。

Ø DISTINCTCOUNT(col)的作用是来计算参数所代表的列的非重复结果的数目。

SUMX函数的作用是返回表中每一行计算的表达式之和。该函数有两个参数：第一个参数表示包含该表达式计算所针对的行的表；第二个参数表示对表中每一行计算的表达式。换言之，SUMX函数要求参与运算的所有字段均在一个表里。

5. 使用ALL函数求各销售单品占总销售额的比例

ALL函数返回表中的所有行或者返回列中的所有值，同时忽略可能已应用的任何筛选器。ALL函数可用于清除筛选器并对表中的所有行创建计算，其表达式如下。

ALL( table , column[, …] )

6. 使用TOTALYTD函数计算本年迄今总计销售额

（具体操作上机练习）

五、实验心得

通过实现，完成了各函数的使用。

实验四、上下文操作和数据钻取（选做）

一、实验目的

1.掌握上下文操作

2.掌握数据钻取

二、实验内容

1.掌握上下文操作

2.掌握数据钻取

三、实验环境

Windows7操作系统

Power Bi Desktop

四、实验步骤

1. 上下文操作

上下文就是DAX公式计算时所处的环境。

筛选上下文只管筛选，行上下文只管迭代，两者互不干涉，各司其职。计算列操作会自动创建行上下文。度量值不会自动创建行上下文，需要人为使用迭代函数进行行上下文的创建（迭代函数本身就会创建行上下文）。

DAX函数会控制筛选上下文。DAX函数进行计算时，会先把筛选上下文应用到数据模型，得到筛选子集后再进行计算。筛选上下文不迭代，行上下文不筛选。

Ø 例如，计算出2个商务指标：2016年度的销售额和任务额。可使用筛选上下文与行上下文操作进行计算，最终效果如下图所示，具体步骤上机练习。

2. 钻取操作

在数据分析中，维度指从事物或现象的某种特征来观察数据的角度，例如可以从销售地区、销售时间、产品名称维度来对销售额进行分析，销售地区、销售时间和产品名称字段都是维度。从销售地区的维度来对销售额进行分析，数据维度的层次可能是地区、省或者市；从销售时间的维度来对销售额进行分析，数据维度的层次可能是年份、季度或者、月份；从产品名称的维度来对销售额进行分析，数据维度的层次可能是产品大类、产品子分类或者产品ID。

钻取操作改变数据维度的层次，变换分析的粒度。它包括向上钻取（drill up）和向下钻取（drill down），又可以简称为上钻和下钻，两者互为反操作。假设对销售额沿着某年份、某季度到某月份的顺序进行数据分析，就叫向下钻取，反之叫向上钻取。

Ø 例如，实现销售额按年份、季度及月份之间的钻取切换，使用向上钻取与向下钻取操作得到的效果如下图所示，实现步骤上机练习。

五、实验心得

通过实现，理解了power bi上下文的意思，完成了数据钻取操作。

核发：nclgjsj 点击数：1022【收藏本页】

返回首页关闭页面