上下文裁剪与压缩¶

Pi 的上下文策略不是粗暴截断，而是结合 token 估算、合法 cut point、turn 边界、split-turn 摘要、文件操作追踪和 session reload 的完整机制。

本章涉及的 token 估算、cut point、split turn、compaction 和 branch summary 行号见源码索引。

关键源码：

触发条件¶

自动压缩使用：

contextTokens > contextWindow - reserveTokens

默认设置在 DEFAULT_COMPACTION_SETTINGS：

AgentSession 在 prompt 前和 agent run 后都会检查 compaction，因此既能预防超窗，也能在 overflow 错误后恢复。

Pi 优先使用最近 assistant message 的真实 usage：

如果完全没有 usage，则所有消息都用字符数除以 4 的保守估算。图片按固定字符量估算，避免视觉输入被当成零成本。

findCutPoint() 从最新消息往前累计 token，直到达到 keepRecentTokens。但它只允许切在合法位置：

它绝不切在 tool result 上，因为 tool result 必须跟着对应 tool call。如果切在带 tool call 的 assistant message，后续 tool result 会被保留。

如果单个 turn 本身超过 keepRecentTokens，切点可能落在这个 turn 中间。Pi 会识别 split-turn：

压缩时会并行生成两个摘要：

最终合并为一个 compaction summary。这样保留的 suffix 仍然能理解本 turn 开头用户到底要求了什么。

如果之前已经有 compaction，新的 prepareCompaction() 会：

这避免多次压缩后摘要只覆盖最近一段，而丢失更早目标、约束和关键决策。

压缩摘要不只写自然语言，还会追加：

<read-files>
...
</read-files>

<modified-files>
...
</modified-files>

文件列表来自：

这是 coding agent 很重要的上下文：继续工作时，模型需要知道读过哪些文件、改过哪些文件。

分支摘要和压缩是姐妹机制。用户在 /tree 中离开某个分支时，Pi 可以：

这样你从一个实验分支回到主分支时，可以把“那边做了什么”以摘要形式带回来，而不用把完整分支历史塞入上下文。

压缩不会改写或删除旧 JSONL entry。它只是追加一个 compaction entry，并让 buildSessionContext() 在当前路径上把它解析成 summary + kept messages。

优点：