探究独立性检验

(整期优先)网络出版时间:2012-12-22
/ 1

探究独立性检验

常佩佩

关键词:独立性检验;概念;步骤;基本思想

随着新课程改革的不断深入,执行和推广新课标是大势所趋。新课标中新增加的教学内容将会不断地出现在今后的高考试题中,而独立性检验问题作为新课改后的添加内容,它在实际生活中有着广泛的应用,特别是它对考查学生“获取信息、应用信息以及数据处理能力”和“应用意识与创新意识”起到了非常重要的作用。正因为如此,它开始在课改地区的高考题和模拟题中“崭露头角”。这一知识点建立在《必修3》的基础上,在实际问题中,经常会面临需要推断的问题,在做推断时需要通过实验来收集数据,并根据独立性检验原理作出合理的推断。教材通过探究“吸烟是否与患肺癌有关系”引出了独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟人群中患肺癌的比例比不吸烟人群中患肺癌的比例要高,使学生直观感觉到吸烟和患肺癌可能有关系。“吸烟与患肺癌有关”这一直觉来自于观测数据,即样本。问题是这种来自于样本的印象能够在多大程度上代表总体?来自于样本的结论“吸烟与患肺癌有关”能够推广到总体吗?为了回答这个问题,就必须借助于统计理论来分析。在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。

一、独立性检验的概念

独立性检验实际上就是检验两个分离变量是否相关,在多大程度上相关。常用的直观方法有:○1列联表;○2三位柱形图;○3二维条形图;○4登高条形图等,得到精确结果的做法是进行独立性检验的有关计算。这里我们主要研究列联表:

二、独立性检验的做法步骤

利用独立性检验来考察两个分离变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体做法是:根据观察数据计算检验随机变量的观察值k,其值越大,说明“x与y有关系”成立的可能性越大。判断的观察值k的大小,仅需确定一个正数,当时就认为的观察值k大。当得到的观察数据a,b,c,d都不小于5时,可以通过查阅下表确定结论“x与y有关系”的可信度。

用统计量研究这类问题的方法称为独立性检验。利用进行独立性检验,可以对推断的正确性的概率做出估计,样本容量n越大,这个估计值越准确。如果抽取的样本容量很小,那么利用进行独立性检验的结果就不具有可靠性。

三、独立性检验的基本思想

1.独立性检验的必要性:列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体。

2.独立性检验的原理(与反证法类似):

反证法假设检验

要证明结论A备择假设H在A不成立的前提下进行推理在H不成立的条件下,即H成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H成立的小概率事件(概率不超过的事件)发生,意味着H成立的可能性(可能性为(1-))很大

没有找到矛盾,不能对A下任何结论,即反证法不成功推出有利于H成立的小概率事件不发生,接受原假设3.典例探讨

通过用字母表示的列联表:

在假设:“吸烟与患肺癌没有关系”的基础上,引导学生得出。

因此,越小,说明吸烟与患肺癌之间关系越弱;越大,说明吸烟与患肺癌之间关系越强。

构造一个随机变(1)(其中为样本容量。)

得出结论:若成立,即“吸烟与患肺癌没有关系”,则应该很小。

根据课本表1中的数据,利用公式(1)计算得到的观测值为:

因为56.632>7.879,所以有99.5%的把握说,吸烟与患肺癌有关系,独立性检验是用来考查两个分类变量是否具有相关关系,并且能较精确地给出这种判断的可靠程度的一种统计方法,利用这一方法,可以直接用的值解决实际问题。这里需特别说明的是:与k的关系并不是,是一个随机变量,它在取不同的值时,可能不同;而k是的观测值,是取定一组数a、b、c、d后的一个确定的值。

参考文献:

[1]教育部.普通高中课程标准实验教科书(选修1~2)[S].北京:人民教育出版社,2003.

[2]张连生.名师伴你行[M].天津:天津人民出版社,2006.

作者单位:河南省三门峡市实验高中

邮政编码:472000