openclaw/cyb50-quant @ 1c90bb65259eded17cd7a06e670a039d8ba5d29d

# GPT Pro 问题清单（2026-04-10）

1) 当前执行状态（已完成）

已按 chinext50_recalibrate_guidance_for_codex_2026-04-09.md 顺序落地：
1. backtest/frozen_walkforward.py（候选评分、硬约束、frontier fallback、违规距离诊断）
2. config/regime.yaml（candidate_selection 默认参数 + window success 配置）
3. pipelines/real_walkforward_report.py（报告语义改为 stitched frozen OOS 主比较）
4. 对应测试补齐并通过

报告新增三套指标：
- default_strategy_full_sample_metrics
- stitched_frozen_oos_metrics
- baseline_full_sample_metrics
comparison 拆分为：
- comparison.stitched_oos_vs_baseline
- comparison.default_vs_baseline
兼容字段保留，映射到 stitched 分支：
- annual_return_delta
- annual_return_delta_vs_baseline
- max_drawdown_delta
- max_drawdown_delta_vs_baseline
- drawdown_ratio_vs_baseline
- utility_delta_vs_baseline
新增窗口语义指标：
- primary_window_count / partial_window_count
- primary_window_success_ratio / partial_window_success_ratio
- window_success_rule
新增产物：
- stitched_frozen_oos_ledger.csv

定向：py -m pytest -q tests/test_frozen_walkforward.py tests/test_real_walkforward_report_pipeline.py
- 结果：11 passed
全量：py -m pytest -q tests
- 结果：81 passed

来源：outputs/real_walkforward_recalibrated_20260409_v2/real_walkforward_summary.json
annual_return_delta = -0.079631
drawdown_ratio_vs_baseline = 0.481396
utility_delta_vs_baseline = -0.134472
upside_capture = 0.284889
hard_pass_window_ratio = 0.8
selection_mode_distribution = {'constraint_score': 4, 'utility_fallback_no_hard_pass': 1}

来源：outputs/real_walkforward_recalibrated_20260410_semantic_v1/real_walkforward_summary.json
comparison.stitched_oos_vs_baseline.annual_return_delta = -0.095134
comparison.stitched_oos_vs_baseline.drawdown_ratio_vs_baseline = 0.552714
comparison.stitched_oos_vs_baseline.utility_delta_vs_baseline = -0.098477
comparison.stitched_oos_vs_baseline.upside_capture = 0.340925
comparison.default_vs_baseline.annual_return_delta = -0.079631
frozen_walkforward.primary_window_success_ratio = 0.5
frozen_walkforward.partial_window_success_ratio = 0.0
frozen_walkforward.hard_pass_window_ratio = 0.6
frozen_walkforward.selection_mode_distribution = {'constraint_score': 3, 'frontier_fallback_no_hard_pass': 2}

在当前语义正确后，第二轮是否优先改 backtest/utility.py（重标定 turnover 惩罚），还是先做 policy mapping（trend/chop/repair/euphoric_late）？
针对 stitched OOS 当前表现（收益仍落后、回撤比上升），请给出建议的参数调整顺序和每轮 guardrail（包括停止条件）。
primary_window_success_ratio=0.5 刚达最低门槛，但 hard_pass_window_ratio=0.6 偏低，建议优先调整哪些约束/权重使 hard-pass 比例恢复到 >=0.8，同时避免再次回到单一候选。
是否建议在当前阶段引入 candidate-level probability/robustness 过滤（如跨窗口稳定性约束）以减少 frontier fallback 次数。