配套资源:微课视频、电子课件、习题答案、教学大纲
本书特色:
系统覆盖数据挖掘与机器学习的主要应用场景。
配有不同领域的案例,如金融风控、医疗诊断、电商推荐等。
结合真实数据集和Python工具,提供实现步骤和代码示例。
涵盖从数据预处理到模型优化的完整流程,并提供编程技巧和实践。
本书配套资源、样书均可在本页下载申请,也可联系微信13146070618索取

本书从实践应用的角度出发,系统介绍了利用Python进行数据挖掘与机器学习所需的基础知识。内容涵盖数据挖掘的基本概念、机器学习的主要算法、Python编程语言基础、数据处理与可视化技术;深入解析了Python在数据挖掘与机器学习领域的核心库和框架,并通过具体实例展示了如何利用这些工具进行数据挖掘、模型训练与预测分析;同时,还介绍了机器学习模型的评估与优化方法,以及模型的实际应用场景。书中大部分章节配有习题与案例分析,旨在帮助读者深入理解并熟练掌握Python数据挖掘与机器学习的关键技能。
本书既可作为高等院校计算机、软件、大数据、人工智能等相关专业的教材,也可作为数据分析师、机器学习工程师等专业人士的技术参考书。
配套资源:微课视频、电子课件、习题答案、教学大纲
本书特色:
系统覆盖数据挖掘与机器学习的主要应用场景。
配有不同领域的案例,如金融风控、医疗诊断、电商推荐等。
结合真实数据集和Python工具,提供实现步骤和代码示例。
涵盖从数据预处理到模型优化的完整流程,并提供编程技巧和实践。
本书配套资源、样书均可在本页下载申请,也可联系微信13146070618索取

本书从实践应用的角度出发,系统介绍了利用Python进行数据挖掘与机器学习所需的基础知识。内容涵盖数据挖掘的基本概念、机器学习的主要算法、Python编程语言基础、数据处理与可视化技术;深入解析了Python在数据挖掘与机器学习领域的核心库和框架,并通过具体实例展示了如何利用这些工具进行数据挖掘、模型训练与预测分析;同时,还介绍了机器学习模型的评估与优化方法,以及模型的实际应用场景。书中大部分章节配有习题与案例分析,旨在帮助读者深入理解并熟练掌握Python数据挖掘与机器学习的关键技能。
本书既可作为高等院校计算机、软件、大数据、人工智能等相关专业的教材,也可作为数据分析师、机器学习工程师等专业人士的技术参考书。
刘锦,男,中南大学计算机学院副教授,新疆大学软件学院副院长,博士/硕士研究生导师,湖南省普通高校青年骨干教师,CCF高级会员,CSIG脑图谱专业委员会委员,CCF生物信息学专委会委员,湖南省神经科学学会帕金森病及运动障碍疾病专委会委员,主要研究方向是人工智能、医疗及健康大数据分析与挖掘、健康监测智能设备研发等。目前已在IEEE TMI、MedIA、IEEE/ACM TCBB、ACL、AAAI等国际学术期刊或会议上发表高水平学术论文60余篇,其中1篇Featured Article,ESI Top 1% 高被引论文6篇,最佳论文奖5次,据Google Scholar统计显示总引用3000余次,单篇最高引用400余次,h指数为28。《Big Data Mining and Analytics》,《工程科学学报》等国内外期刊青年编委。主持或作为科研骨干参与国家重点研发计划、国家自然科学基金面上基金、湖南省重点领域研发计划等省部级科研项目10余项,荣获湖南省优秀博士论文,中国研究型医院学会医学研究创新二等奖、湖南省医学会医学科学技术奖一等奖等多项学术奖励。
前言
绪论
第一部分基础篇
第1章Python基础
11Python运行环境配置
111安装Python
112安装Anaconda
113PyTorch的安装
114编程IDE的安装
12Python基础语法
121标识符、关键字与变量操作
122数据结构与类型
123运算符
124控制结构
125函数
126文件操作
13Python常用库
131NumPy
132Pandas
133Matplotlib
134Scikit-Learn
14小结与习题
第2章数学基础
21线性代数
211向量与矩阵
212矩阵运算
22概率论
221概率分布
222条件概率分布
23微积分
231微分
232积分
24小结与习题
第二部分算法篇
第3章分类
31引例:图像分类
311CIFAR-10数据集
312ResNet分类
32支持向量机
321超平面
322最大间隔 
323基本型的对偶问题
324核函数
33卷积神经网络
331LeNet
332AlexNet
333VGG
334ResNet 
34Transformer
341Vision Transformer
342注意力机制
35小结与习题
第4章回归
41引例:房价预测
411加州房价数据集
412岭回归预测
42线性回归
421最小二乘法
422多元回归
43正则化回归
431岭回归
432LASSO回归
433弹性网回归
44时序回归
441自回归模型
442循环神经网络
443长短期记忆网络
444门控循环单元
45小结与习题
第5章聚类
51引例:鸢尾花的聚类分析
511鸢尾花数据集
512使用K均值聚类算法进行聚类
52K均值聚类
521K均值的基本步骤
522K均值的改进算法
53层次聚类
531层次聚类的基本步骤
532层次聚类的改进算法
54图聚类
541图聚类基础模型
542谱聚类与 Louvain算法
55小结与习题
第6章关联分析
61引例:购物篮关联分析
611线上商城交易数据
612频繁项集和关联规则
613Apriori算法挖掘频繁项集
614结果分析
62Apriori算法
621Apriori性质
622频繁项集的发现
623频繁项集到关联规则
63FP-Growth算法
631原理概述 
632频繁模式树的构建
633频繁模式树的挖掘
634Apriori算法和 FP-Growth算法的优缺点
64频繁子图挖掘与类 Apriori算法
641频繁子图
642候选生成
643候选剪枝
644候选删除
65模式增长类算法——GSpan算法
651深度优先搜索和深度优先搜索树
652DFS编码和最小DFS编码
653最右路径扩展
654GSpan算法原理解析
66小结与习题
第7章异常检测
71引例:服务器异常用户操作检测
711Masquerade Data数据集
712特征提取
713模型训练 
714模型表现评估与 K值选择
72近邻法
721K近邻算法 
722KNN算法改进
73密度法
731局部异常因子算法
732密度法进阶
74自编码器
741编码器与解码器
742自编码器扩展
75小结与习题
第三部分实践篇
第8章案例-皮肤病诊断
81皮肤病数据集ISIC2018
811ISIC2018分类任务数据集
812ISIC2018分割任务数据集
82皮肤病变分类
821ResNet18模型分类
822皮肤病分类结果
83黑色素瘤病灶分割
831UNet模型
832Dice损失函数
833病灶分割结果
84小结
第9章案例-股价预测
91A股股票数据集
911上证指数基本盘数据
912Top5股票基本盘数据
92A股股票收益率预测
921LSTM模型预测
922股价预测结果
93A股股票模拟选股
931LSTM模型预测
932Top5股票预测结果
933Top5股票实际收益计算
94小结
第10章案例-单细胞转录组学
101单细胞数据集
1011单细胞聚类数据集
1012单细胞轨迹分析数据集
102单细胞聚类
1021数据导入和预处理
1022实现单细胞聚类
1023聚类结果分析
103单细胞轨迹分析
1031数据预处理
1032细胞群体划分与关系分析
1033细胞轨迹分析
104小结
第11章案例-商品共现分析与个性化推荐
111商品共现分析
1111任务介绍与数据集准备
1112FP-Growth算法实现商品共现分析
1113结果分析
112电商平台的个性化推荐
1121基于图神经网络进行个性化推荐
1122数据处理
1123用户-商品邻接矩阵的构建
1124NGCF模型实现
1125模型训练与测试
1126结果分析
113小结
第12章案例-农作物损害检测与成因分析
121基于卷积模型的番茄叶片病害识别
1211PlantVillage数据集
1212基于病害数据的卷积模型构建与训练
1213番茄叶片病害识别准确率与模型损失
122农作物异常成因分析
1221Machine Learning in Agriculture数据集
1222基于农作物环境数据的自编码器模型构建与训练
1223作物损害成因分析
123小结
附录符号表
参考文献
					随手扫一扫~了解多多