142.卡方
您可以在百度里搜索“数学之书:数学史上250个里程碑式的发现 艾草文学(www.321553.xyz)”查找最新章节!
※142.卡方
皮尔逊(Karl Pearson,1857—1936)
1900年
卡方值可以帮助我们检定随机抽出100只昆虫的结果,是否符合它们来自于蝴蝶和甲虫数量均等母体的假设;图中实验结果的卡方值高达64,就表示母体数量均等的假设可能站不住脚。
骰子(约公元前3000年),大数法则(1713年),常态分配曲线(1733年),最小平方法(1795年)及拉普拉斯的《概率的分析理论》(1812年)
科学家们经由实验所取得的数据数据,往往与单纯依据概率原理的预期结果不太一致,譬如掷骰子的结果如果与原本期望值有相当大的差距时,我们会说这颗骰子可能有问题,其中一种原因或许是骰子本身重量分配不均。
卡方验定这个方法第一次出现在英国数学家皮尔逊于1900年所发表的论文里,随即被广泛运用在密码学、工程可靠度分析,甚至是棒球选手打击数据的统计工作上。事件必须以独立的方式各别发生(就好像前述掷骰子的例子),是适用卡方检定的前提,一旦我们得知实际观测每起事件的发生频率Oi以及理论上的发生频率E(也就是期望值)时,就可以用方程式χ2=Σ(Oi-E)/ E算出卡方值。如果观察到的事件频率跟期望值一致的话,则卡方值χ2=0;如果两者间的差异越大,卡方值也会跟着同步加大。实际上,研究人员会使用卡方数值表判断两者间的差异是否足够显着,不过要是卡方值太接近0的话,研究人员当然也有可能因为太过多疑,而误用太大或太小的判断标准。
举个例子,我们从蝴蝶和甲虫族群数量假设均等的母体中随机抽出100只昆虫,结果实际上却抽出10只甲虫和90只蝴蝶,此时可得卡方值为χ2=(10-50)/50+(90-50)/50 =64,这个数值已经大到足以认定我们最初的假设—蝴蝶和甲虫来自族群数量均等的母体—可能是不正确的。
皮尔逊一生因研究工作获奖无数,不过,在数学领域之外的皮尔逊,却是一位种族主义者,甚至倡导要对“劣等种族宣战”。 数学之书:数学史上250个里程碑式的发现