多层感知器的SPSS操作

发布于 2021-04-26 03:54 ，所属分类：知识学习综合资讯

作者：王鹏审稿：柏安之封面：吉江

历史文章，点击进入

本节我们主要介绍如何运用SPSS统计软件进行神经网络分析。在本案例中主要根据数据预测低出生体重儿童的比例。在数据中一共有189个孕妇的数据，按照训练集与测试集的比例为7：3，则132个样本数据用于建模，57个样本数据用于测试模型的有效性。注意：为了防止过度拟合，在神经网络中需要对样本进行拆分，一般按照7：3或者4:3:3的比例，形成训练集、验证集和支持集。这里采用SPSS默认的7：3。

由于神经网络模型和内容复杂，因此，这里主要介绍神经网络中多层感知器模型（前向传播模型）的主要操作步骤。

1.操作步骤如下：

第一步，打开“文件”→“打开”→“数据”，将样本数据neural-network.sav导入。

第二步，选择“分析”→“神经网络”→“多层感知”菜单选项。

第三步，将变量“low”选入“因变量”（因为本案例预测低出生儿的比例，所以选择其作为因变量）。

第四步，将变量“ht”选入“因子”，将“lwt”和“pt”选入“协变量”。因各协变量量纲不同，选择"标准化"处理。如图1所示。

第五步，在“分区”选项卡中，可以看到SPSS自动将样本分为“培训”和“检验”，也就是上面提到的训练集和测试集，比例为7：3，支持集为0。

第六步，在“输出”选项卡中，选中“网络结构”选项组的“描述”、“图表”和“键结值”，在“网络性能”中，选择前四个选项。如图2所示。注意：“键结值”是显示系数估计的，它会给某一层与下一层的单元之间的关系（大于0或者小于0）。

第七步，单击“确定”，SPSS会输出结果。这就是多层感知器最基本的操作步骤。

图1

图2

2.结果分析

表1 案例处理汇总

		N	百分比
样本	训练	132	69.8%
样本	测试	57	30.2%
有效		189	100.0%
已排除		0
总计		189

表1分析结果中给出了所有样本的使用情况，可见，SPSS按照7：3比例随机抽出了132个样本用于建模，57个样本用于测试。

表2 网络信息
输入层	因子	1	是否患有高血压
	协变量	1	产妇体重
	协变量	2	本次妊娠前早产次数
		单位数^a	4
		协变量的重标度方法	标准化
隐藏层		隐藏层数	1
		隐藏层 1 中的单位数^a	2
		激活函数	双曲正切
输出层	因变量	1	低出生体重儿
	单位数		2
	激活函数		Softmax
	错误函数		交叉熵

a. 排除偏差单位

表2给出了模型的基本框架，包括：输入层、隐藏层和输出层。可以看到通过样本数据最终建立的是一个隐藏层的模型，该隐藏层包括2个隐单元。因子：一般有分类变量。协变量一般有尺度变量或者连续的自变量。

图3

图3为神经网络的结果示意图，可见因子“ht”分为两个哑变量（0或者1的人工变量）节点，ht=0（没有高血压）,ht=1（患有高血压），相应的两个分类的因变量也以low=0和low=1两个哑变量输出。协变量“lwt”和“ptl”各自以一个节点方式纳入模型。在相邻的两层中，以两种颜色区分连接权重的正负，连接线的粗细代表权重绝对值的大小，从图中可以看出，自变量ht对模型的贡献较大，且输入层的ht=1的节点通过隐藏层H(1:1)节点与输出层low=1节点有较强的连接权重，这表示有高血压的孕妇更容易生出低体重婴儿。

表3 模型汇总
训练	交叉熵错误	74.717
	百分比错误预测	28.8%
	中止使用的规则	错误未减少的 1 连续步骤^a
	培训时间	0:00:00.050
测试	交叉熵错误	31.819
测试	百分比错误预测	24.6%
因变量: 低出生体重儿
a. 基于检验样本的错误计算。

表3显示无论是训练集还是测试集，其相对错误都在25%-30%之间，等于说，预测准确率在70%-75%。

表4输出的是模型对样本的预测分类结果。则训练集和测试集对出生婴儿低体重的预测准确率为29.5%和26.7%。

图4ROC曲线

图4给出了分别针对正常和低出生提供的两个类别的ROC曲线。关于ROC曲线的详细内容，在本gongzhong号的系列内容中已经介绍过。这里不再叙述。

图5累积增益图

图5横轴代表进入预测的个案比例，纵轴代表某类别中已被正确预测的样本占该类别所有被正确预测样本的比例。基线（斜45度直线）代表随机选择得到的结果，模型累积增益线代表使用模型之后的预测结果。图中累积增益线从一开始就明显高于基线，在某一点之后逐渐开始靠近基线并且最终重叠。注意：若累积增益图从左到右开始阶段越陡峭，而且下面所包围的面积越大，则模型的效果越好。

gongzhong号，回复20190517即可获得数据~