【样本量的计算公式】在进行统计研究或实验设计时,样本量的确定是一个非常关键的步骤。合理的样本量可以确保研究结果具有足够的统计效力,同时避免资源浪费。样本量的计算通常依赖于研究的目的、研究设计、预期效应大小、显著性水平和统计功效等因素。
以下是对样本量计算公式的总结,并结合不同研究场景提供相应的计算方式与示例表格。
一、样本量计算的基本概念
1. 统计功效(Power):指在假设检验中,正确拒绝原假设的概率,通常设定为80%或90%。
2. 显著性水平(α):通常设为0.05,表示接受错误结论的可能性。
3. 效应大小(Effect Size):衡量研究变量间差异的大小,常用Cohen's d(均值差除以标准差)。
4. 总体方差(σ²):反映数据的离散程度。
二、常见的样本量计算公式
研究类型 | 公式 | 说明 |
单样本均值检验 | $ n = \left( \frac{Z_{1-\alpha/2} + Z_{1-\beta}}{\delta/\sigma} \right)^2 $ | δ为预期均值差异,σ为总体标准差 |
两独立样本均值比较 | $ n = \left( \frac{Z_{1-\alpha/2} + Z_{1-\beta}}{\delta/\sigma} \right)^2 \times 2 $ | 假设两组方差相等,δ为均值差 |
配对样本均值比较 | $ n = \left( \frac{Z_{1-\alpha/2} + Z_{1-\beta}}{\delta/\sigma_d} \right)^2 $ | σ_d为配对差值的标准差 |
比例比较(如两组成功率) | $ n = \frac{(Z_{1-\alpha/2} + Z_{1-\beta})^2 \cdot (p_1(1-p_1) + p_2(1-p_2))}{(p_1 - p_2)^2} $ | p1、p2为两组比例 |
三、样本量计算示例
研究场景 | 参数设定 | 计算结果(n) | 说明 |
单样本t检验 | α=0.05, β=0.2, δ=0.5, σ=1 | n≈64 | 假设均值差异为0.5,标准差为1 |
两独立样本t检验 | α=0.05, β=0.2, δ=0.5, σ=1 | n≈128 | 每组需要约64人 |
配对样本t检验 | α=0.05, β=0.2, δ=0.5, σ_d=1 | n≈64 | 配对差值标准差为1 |
比例比较 | α=0.05, β=0.2, p1=0.5, p2=0.6 | n≈385 | 每组约193人 |
四、注意事项
- 实际研究中,还需考虑失访率、分层抽样等因素,适当增加样本量。
- 可使用软件如GPower、SPSS、R等进行更精确的样本量计算。
- 样本量过小可能导致结果不可靠,过大则可能造成资源浪费。
通过合理计算样本量,可以提高研究的科学性和可靠性,为后续数据分析奠定坚实基础。