课程代码: 课程名称:数据挖掘与人工智能
学 分: 总 学 时:48
讲课学时:32 实验学时:16
课程类型:专业必修课 先修课程:Java程序设计、python程序设计
适用对象:计算机科学与技术、电子商务
实验学期:7
一、实验教学的目的与基本要求
数据分析是20世纪末刚刚兴起的数据分析技术,由于有广阔的应用前景而备受重视。数据挖掘作为一门新兴的学科,在它的形成和发展过程中表现出了强大的生命力,广大从事数据科学和统计科学的科研工作者和工程技术人员迫切需要了解和掌握它。数据挖掘自产生以来就是以分析数据、理解数据的实际需要为推动力的,其研究发展也逐步渗透到工业、农业、医疗卫生和商业的实际需求当中。数据挖掘涉及的内容较为广泛,已经成为迅速发展并在信息社会中广泛应用的一门综合性学科。数据挖掘已经成为计算机、统计学专业的一门重要课程,也是从事相关研究和应用人员必须掌握的重要知识。
二、基本理论与实验技术知识
通过本课程的实验教学环节,使学生理解和掌握python数据分析的常用库numpy、pandas、matplotlib。
1. 熟悉pycharm的安装和配置。
2. 熟悉jupyter notebook的安装和配置。
3. 熟悉numpy、pandas、matplotlib的使用。
4. 掌握Numpy创建多维数组与随机数的方法
5. 掌握数组的索引与变换
6. 掌握Numpy中数组矩阵的运算及通用函数的基本使用方法
7. 掌握Numpy读写文件的方法和常用的统计分析的函数
8.掌握pyplot常用的绘图参数的调节方法
9.掌握子图的绘制方法
10.掌握绘制图形的保存与展示方法
11.掌握散点图和折线图的作用与绘制方法
12.掌握直方图、饼图和箱线图的作用与绘制方法
13.掌握pyplot常用的绘图参数的调节方法
14.掌握子图的绘制方法
15.掌握绘制图形的保存与展示方法
16.掌握散点图和折线图的作用与绘制方法
17.掌握直方图、饼图和箱线图的作用与绘制方法
8.通过以上实现,设计综合的python数据分析案例。
通过以上实验,培养学生的思维和动手实践意识,提高学生的编程能力。
三、实验方法、特点与基本要求
实验方式:采取学生实验,教师有代表性、有针对性现场指导的实验方式。
基本要求包括:
1. 要求完成每次所规定的实验任务。
2. 做好实验预习,编写源代码。
3. 认真撰写实验报告。
4. 按指定时间上机,不得无故缺席。
5. 严格遵守校规校纪和实验室规章制度。
四、实验主要仪器设备
1.安装有windows操作系统的微机每人一台
2.Anaconda3.0
3.PyCharm Community Edition 2019.1.1 x64
五、实验项目的设置与内容提要
序号 |
实 验 项 目 |
主 要 内 容 |
学时 |
类型 |
每组人数 |
要求 |
教学目标 |
1 |
数据分析平台的搭建 |
1. 熟悉pycharm的安装和配置。 2. 熟悉jupyter notebook的安装和配置。 3. 熟悉numpy、pandas、matplotlib的使用。 |
4 |
设计 |
|
必做 |
|
2 |
Numpy的使用 |
1. 掌握Numpy创建多维数组与随机数的方法 2. 掌握数组的索引与变换 3. 掌握Numpy中数组矩阵的运算及通用函数的基本使用方法 4. 掌握Numpy读写文件的方法和常用的统计分析的函数 |
6 |
设计 |
|
必做 |
|
3 |
Matplotlib数据可视化基础 |
1.掌握pyplot常用的绘图参数的调节方法 2.掌握子图的绘制方法 3.掌握绘制图形的保存与展示方法 4.掌握散点图和折线图的作用与绘制方法 5.掌握直方图、饼图和箱线图的作用与绘制方法 |
4 |
设计/综合 |
|
必做 |
|
4 |
pandas统计分析基础 |
1.掌握常见的数据读取方式 2.掌握DataFrame常用属性与方法 3.掌握基础时间数据处理方法 4.掌握分组聚合的原理与方法 |
4 |
设计/综合 |
|
必做 |
|
5 |
顾客市场细分 |
1.了解顾客市场背景与问题 2.数据介绍 3.分析方法与结论 |
4 |
设计 |
|
必做 |
|
6 |
社交网络分析 |
1、了解处理社交网络的常用R包igraph; 2、掌握社交网络中节点,中心点,社区的概念; 3、掌握igraph包命令graph.adjacency, simplify, V, degree,plot的使用。 |
4 |
设计 |
|
必做 |
|
(注:本实验的先后次序可以根据实际教学情况作出适当调整)
六、实验报告要求
实验一 : 数据分析平台的搭建
一、实验目的
1. 熟悉pycharm的安装和配置。
2. 熟悉jupyter notebook的安装和配置。
3. 熟悉numpy、pandas、matplotlib的使用。
二、实验题目
1. 安装并配置pycharm
2. 安装并测试jupyter notebook
3. 在pythram和notebook上测试numpy、pandas、matplotlib插件
实验二 :Numpy的使用
一、实验目的
1. 掌握Numpy创建多维数组与随机数的方法
2. 掌握数组的索引与变换
3. 掌握Numpy中数组矩阵的运算及通用函数的基本使用方法
4. 掌握Numpy读写文件的方法和常用的统计分析的函数
二、实验题目
1.使用数组进行简单的统计分析
2.创建数组对象
3.通过索引访问数组
4.变换数组的形态
5.创建Numpy矩阵
实验三 :Matplotlib数据可视化基础
一、实验目的
1.掌握pyplot常用的绘图参数的调节方法
2.掌握子图的绘制方法
3.掌握绘制图形的保存与展示方法
4.掌握散点图和折线图的作用与绘制方法
5.掌握直方图、饼图和箱线图的作用与绘制方法
二、实验题目
1.创建pyplot的散点图
2.创建pyplot的折现图
实验四:pandas统计分析基础
一、实验目的
1.掌握常见的数据读取方式
2.掌握DataFrame常用属性与方法
3.掌握基础时间数据处理方法
4.掌握分组聚合的原理与方法
二、实验题目
1.掌握常见的数据读取方式
2.掌握DataFrame常用属性与方法
3.掌握基础时间数据处理方法
4.掌握分组聚合的原理与方法
实验五:顾客市场细分
1.了解顾客市场背景与问题
2.数据介绍
3.分析方法与结论
实验六: 社交网络分析
一、实验目的
1、了解处理社交网络的常用R包igraph;
2、掌握社交网络中节点,中心点,社区的概念;
3、掌握igraph包命令graph.adjacency, simplify, V, degree,plot的使用。
七、考核方式及成绩评定标准
1. 实验考核内容:
(1)实验课出勤情况,必选实验课学生必须参加实验。
(2)积极主动认真做实验。
(3)实验方案过程结果要正确。
2. 成绩评定标准:
优秀:实验中认真操作,实验报告独立完成,字迹工整,实验步骤清晰,程序编制及数据处理正确,有实验分析和总结(特别是总结出实验中出现的问题及解决的方法等);对实验过程自己设计的 ,实验步骤自己编写的,只要无根本性错误。
良好:实验中认真操作,实验报告独立完成,字迹工整,实验步骤清晰,程序编制及数据处理无根本错误。
中等:实验中认真操作,实验报告独立完成,实验步骤清晰,程序编制及数据处理无根本错误。
及格:实验中基本能认真操作,实验报告按标准格式独立完成,程序编制及数据处理无根本错误。
不及格:实验中不认真操作,实验报告不完成,抄袭实验报告,字迹潦草,程序编制及数据处理错误等。
3. 实验成绩占本课程总成绩的20%,
八、推荐教材和教学参考书目与文献
推荐教材:
《Python商业数据分析》,张瑾 主编,中国人民大学出版社,2021.03。
参考书目:
《Python数据分析与挖掘实战》张良郡主编,机械工业出版社, 2019
大纲制订人:周鹤
大纲审定人:
教学院长(主任):
制订日期: 20 年 月 日