Research Log / 1 min read

DiffO 360°图像压缩实验记录

关于 360°图像压缩实验的一次复盘,记录配置检查、训练观察和指标理解。

2026年5月20日 DiffO图像压缩PyTorch实验复盘

实验背景

DiffO 相关实验让我意识到,研究代码的难点不只是“能不能跑”,还包括配置是否一致、日志是否可信、指标是否能解释。

360°图像压缩任务尤其需要注意视角、纹理连续性和训练过程中的稳定性。

运行前检查

我会先确认三个问题:

  • 当前路径是否是预期 repo。
  • 配置文件是否对应本次实验。
  • 日志路径是否干净,避免误读旧结果。
from pathlib import Path

config = Path("configs/train_sod_color_edge.yaml")
log_path = Path("outputs/diffo_360/training.log")

assert config.exists(), "missing experiment config"
print(f"config={config}")
print(f"log={log_path}")

指标理解

压缩实验里的指标不能只看单点数值。我会把重建质量、压缩率和稳定性放在一起看:

Q=αPSNR+βMS-SSIMγBitrateQ = \alpha \cdot PSNR + \beta \cdot MS\text{-}SSIM - \gamma \cdot Bitrate

其中 α\alphaβ\betaγ\gamma 不是固定答案,而是提醒我:不同目标会改变指标权重。

复盘

这类实验最值得记录的是“为什么这次能跑通”。命令、环境、配置、日志和中间现象都应该被写下来,因为下一次复现时,真正救命的往往是这些细节。