计算说明(本节列出脚本中用于计算与检验的公式与步骤,便于复现):

1) 概率估计
   - 观测计数 A_i 为某类别的观测次数,总试验次数为 N(或在两类比较中为 m = A + B)。
   - 类别的估计概率: p_hat = A / N (若只比较两类,则条件概率 p_hat = A / m)。

2) Wilson 置信区间(用于单个类别概率的置信区间,双侧)
   - 给定显著性水平 alpha(双侧),先计算 z = Phi^{-1}(1 - alpha/2)。
   - 设 p_hat = A / N,
     denom = 1 + z^2 / N
     center = p_hat + z^2 / (2N)
     rad = z * sqrt( p_hat*(1-p_hat)/N + z^2/(4N^2) )
     下界 lower = (center - rad) / denom
     上界 upper = (center + rad) / denom
   - 区间被截断到 [0,1]。

3) 两类显著性比较(用于判断 A > B)
   - 只看落在 A 或 B 的样本,令 m = A + B。
   - 在原假设 H0: p_A = p_B(条件下 p = 0.5)下,A ~ Binomial(m, 0.5)。
   - 使用精确二项检验(binomtest)做单侧检验:H1: p_A > 0.5(即 A 的条件概率大于 B)。
   - 得到单侧 p_value(脚本中称为原始 p_value)。

4) 多重比较校正(组内 Bonferroni)
   - 在同一组(例如门组或某方向子组)内做所有两两比较,若组内共有 T 个两两比较,
     则每次检验的显著性阈值设为 alpha_per_test = overall_alpha / T(overall_alpha 默认为 0.05)。
   - 仅当单侧 p_value <= alpha_per_test 时,记录显著结论 A>B(或 B>A)。

5) 差值与效应量(使用总样本 N 作为分母)
   - 在两类比较中,差值定义为:
       diff_total = (A/N) - (B/N),其中 N 为总样本量。
   - 这样差值直接反映在总样本中的概率差异,便于与“误差 ≤1%(按 N 分母)”规则对齐。
   - 在结论页中,差值单元格按以下规则着色:
       <1% → 灰色;1%~2% → 黄色;≥2% → 绿色。

6) 方向比较限制(脚本实现细节)
   - 方向分为两组:直角组 = {Left, Up, Right, Down};斜角组 = {Up-Left, Up-Right, Down-Right, Down-Left}。
   - 仅在组内做两两比较,不跨组比较。

7) 概率统计表(概率统计页)
   - 每个类别的概率由原始计数除以 Total 得到:Door_X = Door_X_count / Total;Dir_Y = Dir_Y_count / Total。

8) 均值/方差/标准差(均值偏差页)
   - 组内均值(例如门组): mean = mean(p_i)(忽略为 0 的项以避免 Total=0 的影响)。
   - 以百分比形式计算偏差列: (p_i - mean) * 100。
   - 方差(%^2)使用样本方差(ddof=0),标准差为方差的平方根(%)。

本页(置信区间验证)中特别说明:
 - Doors 使用的 alpha = 0.05 / 4(Bonferroni 分配用于单个类别的 Wilson 区间计算)。
 - Directions 使用的 alpha = 0.05 / 8(Bonferroni 分配用于单个方向的 Wilson 区间计算)。
实验 4c - Doors
类别 频数 估计概率 下界 上界 误差幅度 ≤1%
Left 10340 0.340625 0.333864 0.347451 0.006826 TRUE
Up 6446 0.212347 0.206543 0.218268 0.005922 TRUE
Right 10415 0.343095 0.336322 0.349933 0.006837 TRUE
Down 12060 0.397286 0.390292 0.404321 0.007035 TRUE
实验 4c - Directions
类别 频数 估计概率 下界 上界 误差幅度 ≤1%
Left 3717 0.122447 0.117395 0.127685 0.005238 TRUE
Up-Left 3734 0.123007 0.117945 0.128255 0.005248 TRUE
Up 1984 0.065358 0.061585 0.069345 0.003987 TRUE
Up-Right 3835 0.126334 0.121212 0.13164 0.005306 TRUE
Right 3593 0.118362 0.113386 0.123526 0.005164 TRUE
Down-Right 5007 0.164943 0.159201 0.17085 0.005907 TRUE
Down 3427 0.112894 0.108022 0.117956 0.005062 TRUE
Down-Left 5059 0.166656 0.160889 0.172586 0.005931 TRUE
实验 4d - Doors
类别 频数 估计概率 下界 上界 误差幅度 ≤1%
Left 10516 0.346422 0.339633 0.353275 0.006852 TRUE
Up 6235 0.205396 0.199665 0.211248 0.005852 TRUE
Right 10482 0.345302 0.338519 0.35215 0.006847 TRUE
Down 12318 0.405785 0.398765 0.412843 0.007058 TRUE
实验 4d - Directions
类别 频数 估计概率 下界 上界 误差幅度 ≤1%
Left 3478 0.114574 0.10967 0.119668 0.005094 TRUE
Up-Left 3552 0.117011 0.112061 0.122151 0.005139 TRUE
Up 1848 0.060878 0.057232 0.064739 0.003862 TRUE
Up-Right 3540 0.116616 0.111673 0.121748 0.005132 TRUE
Right 3401 0.112037 0.107182 0.117083 0.005046 TRUE
Down-Right 5320 0.175254 0.169367 0.1813 0.006046 TRUE
Down 3759 0.123831 0.118754 0.129093 0.005262 TRUE
Down-Left 5458 0.1798 0.173852 0.185905 0.006105 TRUE