产量高低和周期长短究竟有没有关联?—Pearson(皮尔逊)...
原创:菇生 微信公众号:问菇(wengunet)*致力于食用菌生产、技术及投资领域的内容原创,打造一个有态度、有深度、有见地的行业公众号。
篇外话:自上一篇有关两样本t检验的文章发布以来,公众号收到了不少来自食用菌企业生产一线读者关于生产数据分析的相关咨询。
这不由得让小编感受到,当前食用菌技术人员越来越重视生产实践中的理性分析,而不仅仅局限于感性判断,也许意味着食用菌从业人员的专业水平较之以往已经有了很大幅度的提升。
不得不说这是行业的一大幸事,要知道小编之前接触的很多食用菌从业者还是经验主义至上的心态,很少有生产数据收集分析的习惯,就算是在一些上了规模的食用菌企业,由于生产数据收集不合理、不全面,生产记录多为台账性质,根本难以进行科学的数据处理和量化分析。
这次我们邀请特约作者“菇仔”,为“问菇”(wengu)公众号撰写一篇Pearson(皮尔逊)相关分析的SPSS25.0操作教程演示。
PS: SPSS25.0可以自行上网查找下载,或关注问菇(wengunet)微信公众号,从后台联系客服获取免费资源。
一、假设与数据
1、问题假设
某个食用菌企业某个品种第一季度的出菇单产水平差距较大,出菇周期长短也相差甚远。生产经理询问菇房管理员是什么原因造成的?管理员认为第一季度适逢疫情,为推迟出菇,温度降低,出菇周期延长,导致产量降低。管理员拿出了第一季度的34份出菇记录,里面详细记录着每个批次每天的采菇数量和周期天数。
那么,管理员所说的产量高低和周期长短究竟有没有关联?若有又是什么的关系(即是带有趋势的线性关系还是无明显趋势的非线性关系)?关联的强度又是多大(即是高度相关、中等相关还是仅有微弱相关?)
我们可以通过出菇记录收集各个批次的出菇单产和出菇周期数据,首先检验资料是否满足正态分布或近似正态分布,然后通过散点图初步判断二者是否存在相关性以及相关的方向或性质,若存在相关性,由于这两个数据均为计量资料,我们可以进一步计算二者的Pearson相关,进而分析产量高低和周期长短之间相关的方向和强度,从而为生产诊断提供数据支撑,指导下一步的生产改进工作。
2、数据准备
(1)数据录入 现将第一季度34个批次的出菇记录进行收集,获得每个批次的的出菇单产和出菇周期数据,然后将数据录入Excel表格(图1),保存工作簿(本例为:工作簿2)。
图1:数据录入
(2)导入数据 运行SPSS25.0,找到打开文件对话框(图2),文件类型选择Excel数据,选择数据所在的工作簿(即上步骤保存的工作簿2),打开,然后在出现的预览对话框(图3)点击确定,试验数据导入成功(图4)。
图2:打开文件
图3:预览对话框 图4:导入成功 (3)设置变量 可以看到出菇单产变量的小数位数过多,可以切换到变量视图,将出菇单产的小数位数改为0(图5),然后返回数据视图即可看到修改后的数据(图6)。
图5:设置变量
图6:修改后的数据
二、数据分析
1、正态性检验
正态性特质是很多分析方法的基础前提,如果不满足正态性特质,则应该选择其它的分析方法,现将常见的分析方法正态性特质要求归纳如下(图7):
图7:常见的分析方法的正态性特质要求
现在,我们进行正态性检验步骤:
(1)打开菜单点击“分析——描述统计——探索”。
(2)确认变量 在弹出的对话框,将“出菇单产”和“出菇周期”添加到因变量列表(图8:添加因变量),点击“图(T)”,在弹出的窗口勾选”含检验的正态图“(图9:勾选”含检验的正态图“),点击”继续“、返回图8界面点击”确定“,即可查看结果。
图8:添加因变量
图9:勾选”含检验的正态图“
(3)正态性检验结果 根据检验结果(图10),可以看出出菇单产D检验与W检验的P值(0.200、0.985)均大于0.05,该资料服从正态分布;出菇周期D检验与W检验的P值(0.000、0.002)均小于0.05,该资料不服从正态分布,因而需要通过QQ图来判断是否近似正态。
图10:检验结果 通过观察对比正态检验结果中的出菇周期与出菇单产的QQ图(图11),可以看到,二者的分布情况相似,可以判断出菇周期的资料呈近似正态分布。
图11:QQ图
2、散点图分析
(1)选择散点图 点击“图形——旧对话框——散点/点图”,在弹出的对话框中选中“简单散点图(见图12)”。
图12:选择散点图
(2)设置散点图 点击“定义”进入设置界面(如图13),分别将”出菇周期"、“出菇单产”添加到X轴、Y轴变量框中,然后点击确定。
图13:设置散点图
(3)散点图分析 由出菇单产与出菇周期的散点图(图14)可见,出菇单产有随出菇周期变化而变化的线性趋势。本例中出菇单产随着出菇周期的延长而降低,因此,出菇单产与出菇周期之间存在着负线性相关。
图14:出菇单产与出菇周期的散点图
PS:散点图是帮我们定性地发现变量之间的线性趋势,图15展示了8种可能的情况,只有在(1)~(4)情况下,方可计算Pearson相关系数,其他情况不适合计算。
3、Pearson(皮尔逊)相关分析
散点图只能帮助我们发现出菇单产高低和出菇周期是否有线性趋势(即出菇单产高低是否会随出菇周期变化而呈现趋势性变化),但是线性趋势的强弱(出菇周期长短对出菇单产高低的影响到达什么程度)需通过Pearson相关系数进行判定。
(1) 双变量及相关参数设置 点击“分析—相关—双变量”,在弹出的对话框内,将出菇单产、出菇周期添加到右框的变量框内,勾选”皮尔逊(N)"、”双尾“、”标记显著性相关性“复选框(图15),点击确定即可获得Pearson相关计算结果。
图15:双变量及相关参数设置
(2)Pearson相关计算结果 Pearson相关计算结果显示(图16),出菇单产高低和出菇周期的Pearson相关系数r=-0.461,呈中等程度负线性相关关系。
r=-0.461,代表着二者属于中等相关,并非高度、强相关,这是因为制约出菇单产的因素相对复杂,除周期外,菌包质量、日常管理、环境条件等其他方面也会影响着单产的高低。
P=0.006<0.05,说明出菇单产高低和出菇周期的相关性是真实存在的,若P>0.05,则应该认为前面的r=-0.461是假的,并不存在。
图16:Pearson相关计算结果 PS:Pearson相关系数的绝对值越大,相关性越强:即相关系数越接近1或-1,相关度越强,相关系数越接近0,相关度越弱。通常将绝对值0-1分为五个取值范围对应分为五个相关强度级别(图17)。
图17:相关强度级别
三、分析结论
综合以上分析,该食用菌企业第一季度的出菇单产水平波动和出菇周期延长有着较为明显的相关关系,随着出菇周期的延长,出菇单产也相应呈现降低趋势。
这很可能是因为温度的降低,不仅会导致食用菌生长变慢、周期延长,而且会对菇房中的湿度、CO2、内循环等环境因子带来一系列连锁反应,有可能出现菌料失水过多、营养消耗过量、菌袋损耗增加等问题,这些都会对平均后的单位产量造成负面影响。
因此,保持适宜的温度,控制合理的周期,对于确保产量的稳定具有重要的意义。
但是,周期延长不是导致产量降低的唯一原因,温度也不是周期延长的唯一因素。在温度恢复正常的情况下,还应加强在菌包质量、日常管理、环境条件等其他方面的跟踪检查,以确保食用菌生产高产稳产。
点击下列链接,阅读更多相关原创文章:
食用菌企业该如何应对新冠疫情下的生死存亡之战?(三)
食用菌企业该如何应对新冠疫情下的生死存亡之战?(二)
食用菌企业该如何应对新冠疫情下的生死存亡之战?(一)疫情来袭,食用菌生产企业员工的防护口罩何以为继?
食用菌工厂化项目还敢投吗?风向标又指向何方?
有一种看起来像笋,吃起来甜甜的菇,快来拿走不谢!(附栽培技术要点)产地价每公斤78元,黑皮鸡枞鲜品为何还一货难求?
黑皮鸡枞人工栽培初探(三)—— 工厂化栽培篇黑皮鸡枞人工栽培初探(二)—— 制种篇
黑皮鸡枞人工栽培初探(一)—— 覆土篇
食用菌投资手册(二)—— 选址规划(用水篇)
食用菌投资手册(一)—— 选址规划(法规篇)
浅析食用菌工厂化生产的发展沿革(三)
浅析食用菌工厂化生产的发展沿革(二)
浅析食用菌工厂化生产的发展沿革(一)
*如欲了解更多专业资讯和行业干货,请扫描下方二维码,关注问菇公众号。
*声明:本文仅为作者个人观点,不代表问菇(wengunet)立场。*版权说明:本文部分数据及内容根据互联网、书籍、刊物等渠道收集、提炼,如有涉及版权和权利,请联系我们,我们将在第一时间删除或支付稿酬,谢谢!联系邮箱:wengunet@163.com。
页:
[1]