Alle Artikel
2026-03-186 min

API-Kosten bei mehreren OpenClaw-Agenten im Griff behalten

CostAPIOptimizationMulti-Agent

Die Frage, die jeder stellt

"Okay, mehrere KI-Agenten klingen cool. Aber was kostet das wirklich?"

Die ehrliche Antwort: weniger als du denkst — wenn du es richtig aufbaust. Mehr als nötig — wenn du es nicht tust.

Hier sind unsere echten Zahlen und die Entscheidungen dahinter.

---

Unsere Ausgangslage: 6 Agenten, eine Rechnung

Wir betreiben 6 OpenClaw-Agenten:

  • Sam (Teamleitung & Delegation)
  • Peter (Code-Reviews, Bugfixes, Deployment-Checks)
  • Maya (Marketing, Content, Social)
  • Iris (Research, Webrecherche)
  • Alex (Kalender, E-Mails, Alltagsorganisation)
  • Atlas (CEO-Assistent)
  • Jeder läuft 24/7 auf einem Hetzner-Server. Die monatliche Rechnung bei Anthropic: unter 500€.

    Das klingt nach viel. Bis man rechnet, was 40+ Stunden manuelle Arbeit pro Woche sonst kostet.

    ---

    Kostentreiber Nummer 1: Das Modell

    Der größte Hebel ist die Modellwahl. Die Differenz zwischen Claude Opus und Claude Haiku ist kein kleines Detail — es ist ein Faktor 15 im Preis.

    | Modell | Input (1M Token) | Output (1M Token) |

    |-----------------------------|------------------|-------------------|

    | claude-opus-4-5 | $15 | $75 |

    | claude-sonnet-4-5 | $3 | $15 |

    | claude-haiku-3-5 | $1 | $5 |

    Für jeden Agenten die richtige Wahl zu treffen, ist die wichtigste Kostenkontrolle überhaupt.

    Unsere Zuweisung:

  • Atlas → Opus (CEO-Kontext, strategische Inhalte, sichtbares Output)
  • Sam, Peter, Maya, Iris → Sonnet (komplexe Aufgaben, aber strukturiert)
  • Alex → Haiku (Kalender, E-Mails, repetitiv — Haiku reicht komplett)
  • Nur durch diese Differenzierung sparen wir ~60% gegenüber "alle auf Opus".

    ---

    Kostentreiber Nummer 2: Heartbeat-Frequenz

    OpenClaw kann Agenten in regelmäßigen Abständen "aufwecken" — das Heartbeat-System. Standardmäßig alle 30 Minuten.

    Jeder Heartbeat kostet Token. Und wenn ein Agent im Heartbeat unnötige Checks macht — E-Mail-Inbox abfragen, Kalender laden, Websuche starten — summiert sich das.

    Was wir optimiert haben:

    ```json

    // HEARTBEAT.md für Alex (Beispiel)

    Nur handeln wenn:

  • Neue E-Mail mit Betreff DRINGEND
  • Kalendertermin in < 2 Stunden
  • Sonst: HEARTBEAT_OK
  • ```

    Alex antwortet jetzt auf ~80% aller Heartbeats mit `HEARTBEAT_OK` — kein Tool-Call, minimal Token-Verbrauch.

    Faustregel: Je klarer die Bedingungen in HEARTBEAT.md, desto weniger unnötige Aktionen.

    ---

    Kostentreiber Nummer 3: Cron-Jobs vs. Heartbeats

    Nicht jede wiederkehrende Aufgabe sollte als Heartbeat laufen. Cron-Jobs sind oft effizienter, weil:

    1. Sie starten isoliert — kein Session-History-Overhead

    2. Sie nutzen ein optimierbares Modell (z.B. günstigeres Modell für Routineaufgaben)

    3. Sie laufen nur dann, wenn tatsächlich etwas zu tun ist

    Schlechtes Beispiel (teuer):

  • Heartbeat alle 30 Min lädt komplette E-Mail-Inbox
  • Agent durchsucht alles, findet meist nichts
  • Trotzdem 500+ Token pro Durchlauf × 48 Mal pro Tag × 30 Tage = **720.000 Token/Monat nur für Inbox-Checks**
  • Gutes Beispiel (günstig):

  • Cron-Job läuft einmal täglich um 8 Uhr
  • Fasst E-Mails der letzten 24h zusammen
  • 1 Durchlauf × 30 Tage = **30 × ca. 1.500 Token = 45.000 Token/Monat**
  • Das ist ein Faktor 16x Unterschied — für die gleiche Aufgabe.

    ---

    Kostentreiber Nummer 4: Kontext-Fenster und Session-History

    OpenClaw lädt bei jedem Turn die Session-History. Je länger eine Session, desto mehr Input-Token werden bei jedem Turn mitgeschickt.

    Problem: Langlebige Sessions werden teurer mit der Zeit.

    Unsere Lösung:

  • Für dauerhafte Assistenten (Sam, Maya, etc.): Sessions regelmäßig archivieren und neu starten
  • Für zeitgebundene Tasks (Cron-Jobs, Recherchen): isolierte Sessions verwenden
  • Für einfache Aufgaben: kurze, klare Instruktionen — nicht Seiten von Kontext
  • In OpenClaw gibt es dafür das `sessionTarget`-Feld in Cron-Jobs:

    ```json

    {

    "sessionTarget": "isolated",

    "payload": {

    "kind": "agentTurn",

    "message": "Analysiere die letzten 5 GitHub-Issues und fasse zusammen."

    }

    }

    ```

    `isolated` = kein History-Overhead, saubereres Ergebnis, günstigere Ausführung.

    ---

    Kostentreiber Nummer 5: Tool-Calls

    Jeder Tool-Call erzeugt Output-Token (für den Function-Call selbst) und Input-Token (für das Ergebnis, das zurückkommt). Web-Suchen, E-Mail-Reads, Datei-Operationen — alles hat seinen Preis.

    Was hilft:

  • Tools nur dann aufrufen, wenn sie wirklich gebraucht werden (gute HEARTBEAT.md-Bedingungen)
  • Ergebnisse cachen, wenn sie sich selten ändern (z.B. eigene Kontakte oder Konfigurationen)
  • Unnötige Sequential-Chains vermeiden: Wenn zwei Dinge parallel laufen können, parallel laufen lassen
  • ---

    Monitoring: Was wir tatsächlich tracken

    Die OpenClaw-UI zeigt Token-Verbrauch pro Session. Zusätzlich nutzen wir:

    1. Anthropic Console → tägliche Token-Summen pro API-Key

    2. Wöchentlicher Review → Welcher Agent ist teurer geworden? Warum?

    3. Budget-Alerts in der Anthropic Console auf Tageslimit gesetzt

    Wenn ein Agent plötzlich 3× mehr Token verbraucht als die Woche davor, ist das ein Signal — oft ein endloser Cron-Job, ein vergessenes Tool-Call-Loop oder eine unerwartet lange Session.

    ---

    Unsere Kostenzusammenfassung (reale Zahlen)

    | Agent | Modell | Ø Token/Tag | Ø Kosten/Monat |

    |--------|---------|-------------|----------------|

    | Sam | Sonnet | ~80.000 | ~€36 |

    | Peter | Sonnet | ~60.000 | ~€27 |

    | Maya | Sonnet | ~70.000 | ~€32 |

    | Iris | Sonnet | ~90.000 | ~€40 |

    | Alex | Haiku | ~50.000 | ~€5 |

    | Atlas | Opus | ~30.000 | ~€68 |

    Gesamt: ~€208/Monat — plus Server (Hetzner CX21: ~€6/Monat).

    Das ist weit unter dem 500€-Budget, das wir uns gesetzt haben. Der Puffer existiert für Wochen mit mehr Aktivität oder wenn Agenten größere Tasks bekommen.

    ---

    Das Wichtigste in Kürze

    1. Modellwahl ist der größte Hebel — Haiku wo es reicht, Opus nur wo es zählt

    2. Heartbeat-Bedingungen scharf definieren — HEARTBEAT_OK kostet fast nichts

    3. Cron-Jobs für wiederkehrende Tasks — isolierte Sessions sind günstiger

    4. Session-History im Blick behalten — lange Sessions werden teurer

    5. Monitoring aufsetzen — Budget-Alerts in der Provider-Console

    Die detaillierte Konfiguration — HEARTBEAT.md-Vorlagen, Cron-Job-Muster, Docker-Compose mit Modellvariablen — ist im OpenClaw Setup Playbook dokumentiert. Inklusive dem Monitoring-Setup, das wir für den wöchentlichen Review verwenden.

    Komplett auf Deutsch verfügbar. 🇩🇪

    Mehr erfahren?

    Unser Playbook enthält 18 detaillierte Kapitel — komplett auf Deutsch.

    Zum Playbook