| 计算说明(本节列出脚本中用于计算与检验的公式与步骤,便于复现): 1) 概率估计 - 观测计数 A_i 为某类别的观测次数,总试验次数为 N(或在两类比较中为 m = A + B)。 - 类别的估计概率: p_hat = A / N (若只比较两类,则条件概率 p_hat = A / m)。 2) Wilson 置信区间(用于单个类别概率的置信区间,双侧) - 给定显著性水平 alpha(双侧),先计算 z = Phi^{-1}(1 - alpha/2)。 - 设 p_hat = A / N, denom = 1 + z^2 / N center = p_hat + z^2 / (2N) rad = z * sqrt( p_hat*(1-p_hat)/N + z^2/(4N^2) ) 下界 lower = (center - rad) / denom 上界 upper = (center + rad) / denom - 区间被截断到 [0,1]。 3) 两类显著性比较(用于判断 A > B) - 只看落在 A 或 B 的样本,令 m = A + B。 - 在原假设 H0: p_A = p_B(条件下 p = 0.5)下,A ~ Binomial(m, 0.5)。 - 使用精确二项检验(binomtest)做单侧检验:H1: p_A > 0.5(即 A 的条件概率大于 B)。 - 得到单侧 p_value(脚本中称为原始 p_value)。 4) 多重比较校正(组内 Bonferroni) - 在同一组(例如门组或某方向子组)内做所有两两比较,若组内共有 T 个两两比较, 则每次检验的显著性阈值设为 alpha_per_test = overall_alpha / T(overall_alpha 默认为 0.05)。 - 仅当单侧 p_value <= alpha_per_test 时,记录显著结论 A>B(或 B>A)。 5) 差值与效应量(使用总样本 N 作为分母) - 在两类比较中,差值定义为: diff_total = (A/N) - (B/N),其中 N 为总样本量。 - 这样差值直接反映在总样本中的概率差异,便于与“误差 ≤1%(按 N 分母)”规则对齐。 - 在结论页中,差值单元格按以下规则着色: <1% → 灰色;1%~2% → 黄色;≥2% → 绿色。 6) 方向比较限制(脚本实现细节) - 方向分为两组:直角组 = {Left, Up, Right, Down};斜角组 = {Up-Left, Up-Right, Down-Right, Down-Left}。 - 仅在组内做两两比较,不跨组比较。 7) 概率统计表(概率统计页) - 每个类别的概率由原始计数除以 Total 得到:Door_X = Door_X_count / Total;Dir_Y = Dir_Y_count / Total。 8) 均值/方差/标准差(均值偏差页) - 组内均值(例如门组): mean = mean(p_i)(忽略为 0 的项以避免 Total=0 的影响)。 - 以百分比形式计算偏差列: (p_i - mean) * 100。 - 方差(%^2)使用样本方差(ddof=0),标准差为方差的平方根(%)。 本页(置信区间验证)中特别说明: - Doors 使用的 alpha = 0.05 / 4(Bonferroni 分配用于单个类别的 Wilson 区间计算)。 - Directions 使用的 alpha = 0.05 / 8(Bonferroni 分配用于单个方向的 Wilson 区间计算)。 |
||||||
| 实验 4c - Doors | ||||||
| 类别 | 频数 | 估计概率 | 下界 | 上界 | 误差幅度 | ≤1% |
| Left | 10794 | 0.353844 | 0.347036 | 0.360711 | 0.006867 | TRUE |
| Up | 5544 | 0.181741 | 0.176291 | 0.18732 | 0.00558 | TRUE |
| Right | 11003 | 0.360695 | 0.353857 | 0.36759 | 0.006895 | TRUE |
| Down | 10553 | 0.345943 | 0.339173 | 0.352777 | 0.006833 | TRUE |
| 实验 4c - Directi | ||||||
| 类别 | 频数 | 估计概率 | 下界 | 上界 | 误差幅度 | ≤1% |
| Left | 4056 | 0.132962 | 0.127736 | 0.138367 | 0.005406 | TRUE |
| Up-Left | 3713 | 0.121718 | 0.116691 | 0.126929 | 0.005212 | TRUE |
| Up | 1122 | 0.036781 | 0.033946 | 0.039843 | 0.003062 | TRUE |
| Up-Right | 3758 | 0.123193 | 0.11814 | 0.128431 | 0.005238 | TRUE |
| Right | 4075 | 0.133585 | 0.128348 | 0.139001 | 0.005416 | TRUE |
| Down-Right | 5248 | 0.172037 | 0.166209 | 0.178026 | 0.005989 | TRUE |
| Down | 3371 | 0.110506 | 0.105693 | 0.115511 | 0.005004 | TRUE |
| Down-Left | 5162 | 0.169218 | 0.163429 | 0.175169 | 0.005951 | TRUE |
| 实验 4d - Doors | ||||||
| 类别 | 频数 | 估计概率 | 下界 | 上界 | 误差幅度 | ≤1% |
| Left | 10684 | 0.350249 | 0.343458 | 0.357101 | 0.006852 | TRUE |
| Up | 4970 | 0.162929 | 0.157717 | 0.16828 | 0.00535 | TRUE |
| Right | 10991 | 0.360313 | 0.353477 | 0.367207 | 0.006894 | TRUE |
| Down | 11412 | 0.374115 | 0.367221 | 0.38106 | 0.006945 | TRUE |
| 实验 4d - Directi | ||||||
| 类别 | 频数 | 估计概率 | 下界 | 上界 | 误差幅度 | ≤1% |
| Left | 3679 | 0.120607 | 0.115601 | 0.125799 | 0.005192 | TRUE |
| Up-Left | 3333 | 0.109264 | 0.104476 | 0.114245 | 0.00498 | TRUE |
| Up | 1109 | 0.036356 | 0.033537 | 0.039402 | 0.003046 | TRUE |
| Up-Right | 3366 | 0.110346 | 0.105536 | 0.115347 | 0.005001 | TRUE |
| Right | 3774 | 0.123721 | 0.118659 | 0.128969 | 0.005247 | TRUE |
| Down-Right | 5714 | 0.18732 | 0.181288 | 0.193504 | 0.006185 | TRUE |
| Down | 3871 | 0.126901 | 0.121781 | 0.132204 | 0.005303 | TRUE |
| Down-Left | 5658 | 0.185484 | 0.179476 | 0.191646 | 0.006162 | TRUE |