2026-03-186 min

API-Kosten bei mehreren OpenClaw-Agenten im Griff behalten

CostAPIOptimizationMulti-Agent

Die Frage, die jeder stellt

"Okay, mehrere KI-Agenten klingen cool. Aber was kostet das wirklich?"

Die ehrliche Antwort: weniger als du denkst — wenn du es richtig aufbaust. Mehr als nötig — wenn du es nicht tust.

Hier sind unsere echten Zahlen und die Entscheidungen dahinter.

---

Unsere Ausgangslage: 6 Agenten, eine Rechnung

Wir betreiben 6 OpenClaw-Agenten:

Sam (Teamleitung & Delegation)

Peter (Code-Reviews, Bugfixes, Deployment-Checks)

Maya (Marketing, Content, Social)

Iris (Research, Webrecherche)

Alex (Kalender, E-Mails, Alltagsorganisation)

Atlas (CEO-Assistent)

Jeder läuft 24/7 auf einem Hetzner-Server. Die monatliche Rechnung bei Anthropic: unter 500€.

Das klingt nach viel. Bis man rechnet, was 40+ Stunden manuelle Arbeit pro Woche sonst kostet.

---

Kostentreiber Nummer 1: Das Modell

Der größte Hebel ist die Modellwahl. Die Differenz zwischen Claude Opus und Claude Haiku ist kein kleines Detail — es ist ein Faktor 15 im Preis.

| Modell | Input (1M Token) | Output (1M Token) |

|-----------------------------|------------------|-------------------|

| claude-opus-4-5 | $15 | $75 |

| claude-sonnet-4-5 | $3 | $15 |

| claude-haiku-3-5 | $1 | $5 |

Für jeden Agenten die richtige Wahl zu treffen, ist die wichtigste Kostenkontrolle überhaupt.

Unsere Zuweisung:

Atlas → Opus (CEO-Kontext, strategische Inhalte, sichtbares Output)

Sam, Peter, Maya, Iris → Sonnet (komplexe Aufgaben, aber strukturiert)

Alex → Haiku (Kalender, E-Mails, repetitiv — Haiku reicht komplett)

Nur durch diese Differenzierung sparen wir ~60% gegenüber "alle auf Opus".

---

Kostentreiber Nummer 2: Heartbeat-Frequenz

OpenClaw kann Agenten in regelmäßigen Abständen "aufwecken" — das Heartbeat-System. Standardmäßig alle 30 Minuten.

Jeder Heartbeat kostet Token. Und wenn ein Agent im Heartbeat unnötige Checks macht — E-Mail-Inbox abfragen, Kalender laden, Websuche starten — summiert sich das.

Was wir optimiert haben:

```json

// HEARTBEAT.md für Alex (Beispiel)

Nur handeln wenn:

Neue E-Mail mit Betreff DRINGEND

Kalendertermin in < 2 Stunden

Sonst: HEARTBEAT_OK

```

Alex antwortet jetzt auf ~80% aller Heartbeats mit `HEARTBEAT_OK` — kein Tool-Call, minimal Token-Verbrauch.

Faustregel: Je klarer die Bedingungen in HEARTBEAT.md, desto weniger unnötige Aktionen.

---

Kostentreiber Nummer 3: Cron-Jobs vs. Heartbeats

Nicht jede wiederkehrende Aufgabe sollte als Heartbeat laufen. Cron-Jobs sind oft effizienter, weil:

1. Sie starten isoliert — kein Session-History-Overhead

2. Sie nutzen ein optimierbares Modell (z.B. günstigeres Modell für Routineaufgaben)

3. Sie laufen nur dann, wenn tatsächlich etwas zu tun ist

Schlechtes Beispiel (teuer):

Heartbeat alle 30 Min lädt komplette E-Mail-Inbox

Agent durchsucht alles, findet meist nichts

Trotzdem 500+ Token pro Durchlauf × 48 Mal pro Tag × 30 Tage = **720.000 Token/Monat nur für Inbox-Checks**

Gutes Beispiel (günstig):

Cron-Job läuft einmal täglich um 8 Uhr

Fasst E-Mails der letzten 24h zusammen

1 Durchlauf × 30 Tage = **30 × ca. 1.500 Token = 45.000 Token/Monat**

Das ist ein Faktor 16x Unterschied — für die gleiche Aufgabe.

---

Kostentreiber Nummer 4: Kontext-Fenster und Session-History

OpenClaw lädt bei jedem Turn die Session-History. Je länger eine Session, desto mehr Input-Token werden bei jedem Turn mitgeschickt.

Problem: Langlebige Sessions werden teurer mit der Zeit.

Unsere Lösung:

Für dauerhafte Assistenten (Sam, Maya, etc.): Sessions regelmäßig archivieren und neu starten

Für zeitgebundene Tasks (Cron-Jobs, Recherchen): isolierte Sessions verwenden

Für einfache Aufgaben: kurze, klare Instruktionen — nicht Seiten von Kontext

In OpenClaw gibt es dafür das `sessionTarget`-Feld in Cron-Jobs:

```json

{

"sessionTarget": "isolated",

"payload": {

"kind": "agentTurn",

"message": "Analysiere die letzten 5 GitHub-Issues und fasse zusammen."

}

```

`isolated` = kein History-Overhead, saubereres Ergebnis, günstigere Ausführung.

---

Kostentreiber Nummer 5: Tool-Calls

Jeder Tool-Call erzeugt Output-Token (für den Function-Call selbst) und Input-Token (für das Ergebnis, das zurückkommt). Web-Suchen, E-Mail-Reads, Datei-Operationen — alles hat seinen Preis.

Was hilft:

Tools nur dann aufrufen, wenn sie wirklich gebraucht werden (gute HEARTBEAT.md-Bedingungen)

Ergebnisse cachen, wenn sie sich selten ändern (z.B. eigene Kontakte oder Konfigurationen)

Unnötige Sequential-Chains vermeiden: Wenn zwei Dinge parallel laufen können, parallel laufen lassen

---

Monitoring: Was wir tatsächlich tracken

Die OpenClaw-UI zeigt Token-Verbrauch pro Session. Zusätzlich nutzen wir:

1. Anthropic Console → tägliche Token-Summen pro API-Key

2. Wöchentlicher Review → Welcher Agent ist teurer geworden? Warum?

3. Budget-Alerts in der Anthropic Console auf Tageslimit gesetzt

Wenn ein Agent plötzlich 3× mehr Token verbraucht als die Woche davor, ist das ein Signal — oft ein endloser Cron-Job, ein vergessenes Tool-Call-Loop oder eine unerwartet lange Session.

---

Unsere Kostenzusammenfassung (reale Zahlen)

|--------|---------|-------------|----------------|

| Sam | Sonnet | ~80.000 | ~€36 |

| Peter | Sonnet | ~60.000 | ~€27 |

| Maya | Sonnet | ~70.000 | ~€32 |

| Iris | Sonnet | ~90.000 | ~€40 |

| Alex | Haiku | ~50.000 | ~€5 |

| Atlas | Opus | ~30.000 | ~€68 |

Gesamt: ~€208/Monat — plus Server (Hetzner CX21: ~€6/Monat).

Das ist weit unter dem 500€-Budget, das wir uns gesetzt haben. Der Puffer existiert für Wochen mit mehr Aktivität oder wenn Agenten größere Tasks bekommen.

---

Das Wichtigste in Kürze

1. Modellwahl ist der größte Hebel — Haiku wo es reicht, Opus nur wo es zählt

2. Heartbeat-Bedingungen scharf definieren — HEARTBEAT_OK kostet fast nichts

3. Cron-Jobs für wiederkehrende Tasks — isolierte Sessions sind günstiger

4. Session-History im Blick behalten — lange Sessions werden teurer

5. Monitoring aufsetzen — Budget-Alerts in der Provider-Console

Die detaillierte Konfiguration — HEARTBEAT.md-Vorlagen, Cron-Job-Muster, Docker-Compose mit Modellvariablen — ist im OpenClaw Setup Playbook dokumentiert. Inklusive dem Monitoring-Setup, das wir für den wöchentlichen Review verwenden.

Komplett auf Deutsch verfügbar. 🇩🇪

Mehr erfahren?

Unser Playbook enthält 18 detaillierte Kapitel — komplett auf Deutsch.

Zum Playbook