本书选择了数据挖掘中最常用的多元统计分析方法, 主要包括多元统计图、多元统计特征以及用于聚类与分类的聚类分析和判别分析、用于数据压缩的主成分分析和因子分析、用于预测和影响因素分析的线性回归、曲线回归和逐步回归等内容, 并在论述这些方法时, 以本科生可接受的基本原理和方法实现为主。
第1章 多元统计图
1.1二元变量的散文图
1.2三元变量的气泡图
1.3多元变量的雷达图
1.4比较多变量分布的箱线图
1.5多元统计图的应用
第2章 多元变量的统计特征
2.1均值向量与协方差矩阵
2.2相关系数矩阵与显著性检验
2.3偏相关系数与显著性检验
2.4多元正态分布及其参数估计
2.5正态性的识别与检验
第3章 聚类分析
3.1相似性的变量
3.2系统聚类法
3.3K-均值聚类法
3.4类别数的确定方法
3.5类与类之间的差异性分析
第4章 判别分析
4.1模式识别与判别分析的基本原理
4.2距离判别法
4.3Bayes判别法
4.4判别方法的有效性
4.5距离判别与Bayes判别之间的关系
第5章 主成分分析
5.1主成分分析的基本原理
5.2理论主成分
5.3样本主成分
5.4保留主成分的合理性
5.5主成分分析的应用
第6章 因子分析
6.1因子分析的基本原理
6.2因子载荷的求解
6.3因子分析的有效性
6.4公因子得分
6.5因子分析的应用
第7章回归分析
7.1相关系数与一元回归模型
7.2偏相关系数与多元回归模型
7.3回归诊断方法
7.4曲线回归
7.5柯布—道路拉斯生产函数与建模流程
第8章 多重共线性的处理方法
8.1 多重共线性问题
8.2多重共线性的诊断
8.3主成分回归
8.4逐步回归分析
8.5逐步回归法的改进
8.6多元回归建模流程
参考文献
附录 部分彩图