格格党

手机浏览器扫描二维码访问

二数据的初步整理(第1页)

二、数据的初步整理

banner"

>

任何数据资料在进行分析前都需要进行无效数据的筛选和剔除。

判断无效数据的标准有以下几点。

第一,录入错误。

数据录入过程中的错误不可避免,有些错误通过检查是可以得到发现并更正的,如图12-2与图12-3中列出的第6条数据的性别,在数据中录入的值是3,明显是录入错误,这种情况下可以根据编号找回原始问卷进行修改。

第二,数据漏答、错答比较多。

一般情况下,错漏答问题数超过全部问题数的5%可以认为被调查者并没有认真完成调查,该条数据无效,需要剔除。

第三,回答呈现出某种机械的规律性。

如果被调查者的选择集中于某个选项或者规律性地在几个选项之间循环,如“111111”

“555555”

或者“1234554321”

“1234512345”

等,都表明被调查者并没有真正地回答问题,数据无效,需要剔除。

第四,测谎题超标。

如果调查问卷含有测谎题,被调查者在测谎题上面的回答显示其说谎,则说明被调查者并没有真实地回答问题,数据无效,需要剔除。

第五,异常数据。

异常数据有两类,一类是明显的逻辑错误题,比如被调查者在回答是否是独生子女时选择“是”

,在回答父母是否偏心时也选择“是”

,则说明至少一个问题上的回答是虚假的,反映被调查者的配合度比较低,可以考虑剔除数据。

另一类是指在总体数据中,个别数据的数值极端大或者极端小。

比如心理学实验中被试的反应时如果低于100毫秒,说明被试没有看到刺激就按键反应,属于无效数据。

另外也可根据三个标准差的原则剔除极端数据,即删除平均数加减三个标准差以外的数据。

例如,在分析两个班级的语文成绩是否有差异时,可能会存在一些极端成绩,并不能代表班级的一般水平,就需要按三个标准差的原则剔除极高分与极低分。

具体做法为:假设A班平均分为80分,标准差为6分,则A班98分以上和62分以下的成绩属于三个标准差以外的极端数据,需要删除。

根据以上标准经过无效数据删除后的数据才是最后用于统计分析的有效数据。

本周收藏榜
热门小说推荐
出狱后,首富老公逼我生三胎

出狱后,首富老公逼我生三胎

海城最骄傲的千金宋欢入狱了,传闻是她最深爱的丈夫做的。傅辰年说,她害死了陈琦月的孩子,她该死!一场婚姻,她许他入骨深情,他赠她锒铛入狱。三年折磨,磨去了宋欢一身的傲骨。出狱后,她只想带着孩子好好生活,却被傅辰年找上门来绮月不能再生育,你还欠我们一个孩子!自此,她又踏进了地狱。他大婚那日,她死在了手术台上,一尸三命那场盛世婚礼上,她的死讯传来,新郎猩红了眼眶,一瞬白头。四年后。三个包子看着还在苦苦寻找他们妈咪的男人,小肉手一挥不要再找我们了!我们已经找到满意的新爸爸,不要你啦!...

假装自己是学霸

假装自己是学霸

学霸系统降临。只要学习,就可以增加积分!叮!您解答了数学题目,数学积分2叮!你查看了英语单词,英语积分1叮!您进行了一次化学分析,化学积分1000叮!…您的化学积分已经足够,等级提升...

视死如归魏君子

视死如归魏君子

魏君确认自己被杀死后就能直接无敌,于是他开始疯狂的作死。然后,他发现这个世界有毒。当初仙门凌驾于朝堂之上作威作福,满朝文武包括朕皆对仙人卑躬屈膝,只有魏君一身是胆,视死如归,在众目睽...

大理寺卿的宠妻日常

大理寺卿的宠妻日常

全京城的人都以为顾九会是秦峥的心头刺,直到见证了世子爷是如何宠妻无度,才发现,哪有什么心头刺,那分明是他的掌中娇。重生之后,顾九发誓要护至亲忠仆...

我的亿万冷少

我的亿万冷少

取悦我,价格随你开!他桀骜的眼神里噙满戏谑。凌婧萱深知配不上他,更玩不起豪门少爷们寻欢作乐的游戏,为了讨生活她甘愿躺在他的身下。一场激情,他畅快淋漓,她生不如死!一纸契约,一场报复,她在他设的...

每日热搜小说推荐