|
关于假设检验的误解:客观概率与统计检验力
|
Abstract:
文章主要是揭示目前假设检验常见误解,以提供正确使用方法。首先简单回顾假设检验的哲学基础,揭示证伪法对于假设检验的重要性。以两样本t检验为例,测查心理与教育统计学习者对假设检验的理解。结果发现超过六成的学习者没能正确理解客观概率,超过八成的学习者没能正确理解统计检验力。假设检验使用客观概率解释概率,客观概率是相对于事件集合而言,零假设和备择假设都是属于单个事件并没有概率,不应错误使用p值。统计软件算出的p值也没有说明统计检验力,实验设计必须事先计算统计检验力。
The main purpose of this article is to reveal the common misconceptions about hypothesis testing and provide the correct way to use it. First, the philosophical basis of hypothesis testing is briefly reviewed, and the importance of falsificationism for hypothesis testing is revealed. The two-sample t-test is used as an example to test the understanding of hypothesis testing among learners in psychological and educational statistics. The results show that more than 60% of the learners failed to correctly understand the objective probability, and more than 80% of the learners failed to correctly understand the power of the test. Hypothesis testing uses objective probabilities to explain probability, which is relative to the set of events, and both the null hypothesis and the alternative hypothesis belong to a single event and have no probability, and the p-value should not be used incorrectly. The p-value calculated by the statistical software also does not indicate the statistical power, and the experimental design must calculate the statistical power in advance.
[1] | Hume, D. (1748). 人类理解研究(1997版). 商务印书馆. |
[2] | Popper, K. (1959). 科学发现的逻辑(2008版). 中国美术学院出版社. |
[3] | Popper, K. (1963). 猜想与反驳(2015版). 上海译文出版社. |
[4] | Popper, K. (1972). 客观知识(2015版). 上海译文出版社. |
[5] | 但冰如, 谢志刚(1991). 主观概率与概率的多元结构. 运筹学杂志, 10(2), 39-45. |
[6] | 范超(2016). 概率是物质属性还是主观认识——频率学派与贝叶斯学派的区别. 中国统计, 31(8), 40-41. |
[7] | 黄涛(1998). 主观概率判断的演进. 数量经济技术经济研究, 15(5), 45-50. |
[8] | 李旭燕(2008). 可换性: 在主观概率与客观概率之间. 求索, (10), 98-100. |
[9] | 李旭燕(2009). 单个事件有客观概率吗?——从现代归纳逻辑客观解释的角度探赜. 求索, (6), 132-134. |
[10] | 林定夷(2016). 论科学中观察与理论的关系. 中山大学出版社. |
[11] | 吕小康(2012). Fisher与Neyman-Pearson的分歧与心理统计中的假设检验争议. 心理科学, 35(6), 1502-1506. |
[12] | 莫雷(2019). 心理学研究方法(修订本). 广东高等教育出版社. |
[13] | 蒲显伟(2016). 定量数据分析效应值: 意义、计算与解释. 心理学探新, 36(1), 64-69. |
[14] | 温忠麟, 方杰, 沈嘉琦, 谭倚天, 李定欣, 马益铭(2021). 新世纪20年国内心理统计方法研究回顾. 心理科学进展, 29(8), 1331-1344. |
[15] | 温忠麟, 谢晋艳, 方杰, 王一帆(2022). 新世纪20年国内假设检验及其关联问题的方法学研究. 心理科学进展, 30(8), 1667-1681. |
[16] | 吴艳, 温忠麟(2011). 与零假设检验有关的统计分析流程. 心理科学, 34(1), 230-234. |
[17] | Oakes, M. (1990). Statistical Inference. Epidemiology Resources. |