gpt_pro_issues_2026-04-10.md 3.6 KB

# GPT Pro 问题清单(2026-04-10)

1) 当前执行状态(已完成)

  • 已按 chinext50_recalibrate_guidance_for_codex_2026-04-09.md 顺序落地:
    1. backtest/frozen_walkforward.py(候选评分、硬约束、frontier fallback、违规距离诊断)
    2. config/regime.yaml(candidate_selection 默认参数 + window success 配置)
    3. pipelines/real_walkforward_report.py(报告语义改为 stitched frozen OOS 主比较)
    4. 对应测试补齐并通过

2) 代码侧关键变化

  • 报告新增三套指标:
    • default_strategy_full_sample_metrics
    • stitched_frozen_oos_metrics
    • baseline_full_sample_metrics
  • comparison 拆分为:
    • comparison.stitched_oos_vs_baseline
    • comparison.default_vs_baseline
  • 兼容字段保留,映射到 stitched 分支:
    • annual_return_delta
    • annual_return_delta_vs_baseline
    • max_drawdown_delta
    • max_drawdown_delta_vs_baseline
    • drawdown_ratio_vs_baseline
    • utility_delta_vs_baseline
  • 新增窗口语义指标:
    • primary_window_count / partial_window_count
    • primary_window_success_ratio / partial_window_success_ratio
    • window_success_rule
  • 新增产物:
    • stitched_frozen_oos_ledger.csv

3) 测试状态

  • 定向:py -m pytest -q tests/test_frozen_walkforward.py tests/test_real_walkforward_report_pipeline.py
    • 结果:11 passed
  • 全量:py -m pytest -q tests
    • 结果:81 passed

4) 关键指标对比(旧 vs 新语义)

旧版(default vs baseline)

  • 来源:outputs/real_walkforward_recalibrated_20260409_v2/real_walkforward_summary.json
  • annual_return_delta = -0.079631
  • drawdown_ratio_vs_baseline = 0.481396
  • utility_delta_vs_baseline = -0.134472
  • upside_capture = 0.284889
  • hard_pass_window_ratio = 0.8
  • selection_mode_distribution = {'constraint_score': 4, 'utility_fallback_no_hard_pass': 1}

新版(stitched + default 拆分)

  • 来源:outputs/real_walkforward_recalibrated_20260410_semantic_v1/real_walkforward_summary.json
  • comparison.stitched_oos_vs_baseline.annual_return_delta = -0.095134
  • comparison.stitched_oos_vs_baseline.drawdown_ratio_vs_baseline = 0.552714
  • comparison.stitched_oos_vs_baseline.utility_delta_vs_baseline = -0.098477
  • comparison.stitched_oos_vs_baseline.upside_capture = 0.340925
  • comparison.default_vs_baseline.annual_return_delta = -0.079631
  • frozen_walkforward.primary_window_success_ratio = 0.5
  • frozen_walkforward.partial_window_success_ratio = 0.0
  • frozen_walkforward.hard_pass_window_ratio = 0.6
  • frozen_walkforward.selection_mode_distribution = {'constraint_score': 3, 'frontier_fallback_no_hard_pass': 2}

5) 需要 GPT Pro 精确指导的问题

  1. 在当前语义正确后,第二轮是否优先改 backtest/utility.py(重标定 turnover 惩罚),还是先做 policy mapping(trend/chop/repair/euphoric_late)?
  2. 针对 stitched OOS 当前表现(收益仍落后、回撤比上升),请给出建议的参数调整顺序和每轮 guardrail(包括停止条件)。
  3. primary_window_success_ratio=0.5 刚达最低门槛,但 hard_pass_window_ratio=0.6 偏低,建议优先调整哪些约束/权重使 hard-pass 比例恢复到 >=0.8,同时避免再次回到单一候选。
  4. 是否建议在当前阶段引入 candidate-level probability/robustness 过滤(如跨窗口稳定性约束)以减少 frontier fallback 次数。

6) 建议 GPT Pro 回传格式

  • 分三层输出:
    1. 必改(blocking)
    2. 建议改(high impact)
    3. 可选改(nice-to-have)
  • 每条建议请附:
    • 目标文件
    • 精确参数/公式
    • 预期影响方向
    • 验证指标与阈值