API-Kosten bei mehreren OpenClaw-Agenten im Griff behalten
Die Frage, die jeder stellt
"Okay, mehrere KI-Agenten klingen cool. Aber was kostet das wirklich?"
Die ehrliche Antwort: weniger als du denkst — wenn du es richtig aufbaust. Mehr als nötig — wenn du es nicht tust.
Hier sind unsere echten Zahlen und die Entscheidungen dahinter.
---
Unsere Ausgangslage: 6 Agenten, eine Rechnung
Wir betreiben 6 OpenClaw-Agenten:
Jeder läuft 24/7 auf einem Hetzner-Server. Die monatliche Rechnung bei Anthropic: unter 500€.
Das klingt nach viel. Bis man rechnet, was 40+ Stunden manuelle Arbeit pro Woche sonst kostet.
---
Kostentreiber Nummer 1: Das Modell
Der größte Hebel ist die Modellwahl. Die Differenz zwischen Claude Opus und Claude Haiku ist kein kleines Detail — es ist ein Faktor 15 im Preis.
| Modell | Input (1M Token) | Output (1M Token) |
|-----------------------------|------------------|-------------------|
| claude-opus-4-5 | $15 | $75 |
| claude-sonnet-4-5 | $3 | $15 |
| claude-haiku-3-5 | $1 | $5 |
Für jeden Agenten die richtige Wahl zu treffen, ist die wichtigste Kostenkontrolle überhaupt.
Unsere Zuweisung:
Nur durch diese Differenzierung sparen wir ~60% gegenüber "alle auf Opus".
---
Kostentreiber Nummer 2: Heartbeat-Frequenz
OpenClaw kann Agenten in regelmäßigen Abständen "aufwecken" — das Heartbeat-System. Standardmäßig alle 30 Minuten.
Jeder Heartbeat kostet Token. Und wenn ein Agent im Heartbeat unnötige Checks macht — E-Mail-Inbox abfragen, Kalender laden, Websuche starten — summiert sich das.
Was wir optimiert haben:
```json
// HEARTBEAT.md für Alex (Beispiel)
Nur handeln wenn:
```
Alex antwortet jetzt auf ~80% aller Heartbeats mit `HEARTBEAT_OK` — kein Tool-Call, minimal Token-Verbrauch.
Faustregel: Je klarer die Bedingungen in HEARTBEAT.md, desto weniger unnötige Aktionen.
---
Kostentreiber Nummer 3: Cron-Jobs vs. Heartbeats
Nicht jede wiederkehrende Aufgabe sollte als Heartbeat laufen. Cron-Jobs sind oft effizienter, weil:
1. Sie starten isoliert — kein Session-History-Overhead
2. Sie nutzen ein optimierbares Modell (z.B. günstigeres Modell für Routineaufgaben)
3. Sie laufen nur dann, wenn tatsächlich etwas zu tun ist
Schlechtes Beispiel (teuer):
Gutes Beispiel (günstig):
Das ist ein Faktor 16x Unterschied — für die gleiche Aufgabe.
---
Kostentreiber Nummer 4: Kontext-Fenster und Session-History
OpenClaw lädt bei jedem Turn die Session-History. Je länger eine Session, desto mehr Input-Token werden bei jedem Turn mitgeschickt.
Problem: Langlebige Sessions werden teurer mit der Zeit.
Unsere Lösung:
In OpenClaw gibt es dafür das `sessionTarget`-Feld in Cron-Jobs:
```json
{
"sessionTarget": "isolated",
"payload": {
"kind": "agentTurn",
"message": "Analysiere die letzten 5 GitHub-Issues und fasse zusammen."
}
}
```
`isolated` = kein History-Overhead, saubereres Ergebnis, günstigere Ausführung.
---
Kostentreiber Nummer 5: Tool-Calls
Jeder Tool-Call erzeugt Output-Token (für den Function-Call selbst) und Input-Token (für das Ergebnis, das zurückkommt). Web-Suchen, E-Mail-Reads, Datei-Operationen — alles hat seinen Preis.
Was hilft:
---
Monitoring: Was wir tatsächlich tracken
Die OpenClaw-UI zeigt Token-Verbrauch pro Session. Zusätzlich nutzen wir:
1. Anthropic Console → tägliche Token-Summen pro API-Key
2. Wöchentlicher Review → Welcher Agent ist teurer geworden? Warum?
3. Budget-Alerts in der Anthropic Console auf Tageslimit gesetzt
Wenn ein Agent plötzlich 3× mehr Token verbraucht als die Woche davor, ist das ein Signal — oft ein endloser Cron-Job, ein vergessenes Tool-Call-Loop oder eine unerwartet lange Session.
---
Unsere Kostenzusammenfassung (reale Zahlen)
| Agent | Modell | Ø Token/Tag | Ø Kosten/Monat |
|--------|---------|-------------|----------------|
| Sam | Sonnet | ~80.000 | ~€36 |
| Peter | Sonnet | ~60.000 | ~€27 |
| Maya | Sonnet | ~70.000 | ~€32 |
| Iris | Sonnet | ~90.000 | ~€40 |
| Alex | Haiku | ~50.000 | ~€5 |
| Atlas | Opus | ~30.000 | ~€68 |
Gesamt: ~€208/Monat — plus Server (Hetzner CX21: ~€6/Monat).
Das ist weit unter dem 500€-Budget, das wir uns gesetzt haben. Der Puffer existiert für Wochen mit mehr Aktivität oder wenn Agenten größere Tasks bekommen.
---
Das Wichtigste in Kürze
1. Modellwahl ist der größte Hebel — Haiku wo es reicht, Opus nur wo es zählt
2. Heartbeat-Bedingungen scharf definieren — HEARTBEAT_OK kostet fast nichts
3. Cron-Jobs für wiederkehrende Tasks — isolierte Sessions sind günstiger
4. Session-History im Blick behalten — lange Sessions werden teurer
5. Monitoring aufsetzen — Budget-Alerts in der Provider-Console
Die detaillierte Konfiguration — HEARTBEAT.md-Vorlagen, Cron-Job-Muster, Docker-Compose mit Modellvariablen — ist im OpenClaw Setup Playbook dokumentiert. Inklusive dem Monitoring-Setup, das wir für den wöchentlichen Review verwenden.
Komplett auf Deutsch verfügbar. 🇩🇪