Die drei Budget-Kategorien
Das Budget-System verfolgt den Token-Verbrauch in drei Kategorien:
| Kategorie | Beschreibung | Beispiel |
| Input-Tokens | Tokens im Prompt + Kontext | "Analysiere die Datei main.py" |
| Output-Tokens | Tokens in der generierten Antwort | Befehlsvorschlaege, Erklaerungen |
| Total-Budget | Maximale Tokens pro Session | Standard: 100.000 Tokens |
Budget-Tracking im Code
Die Budget-Verwaltung erfolgt in der QueryEnginePort Klasse:
class TurnBudget:
def __init__(self, max_tokens=100_000):
self.max_tokens = max_tokens
self.used_input = 0
self.used_output = 0
def track_turn(self, input_tokens, output_tokens):
self.used_input += input_tokens
self.used_output += output_tokens
def remaining(self):
return self.max_tokens - (self.used_input + self.used_output)
Kompaktierung bei Budget-Knappheit
Wenn das Budget knapp wird, wird automatisch kompaktisiert:
Turn 3/10: Budget bei 80%
- Kompaktierung gestartet
- Alte Turns werden zusammengefasst
- Kontext reduziert, Kerninformationen erhalten
Turn 4/10: Weiter mit kompaktem Kontext
⚠
Hinweis zur Simulation
Das Budget-System im Claw Code ist eine Simulation. Es zeigt, wie das originale System Ressourcen verwaltet haette, ohne echte API-Kosten zu verursachen. Die Token-Zahlen sind Schaetzungen basierend auf Wort-Charakter-Verhaeltnissen.