9Router – Wichtigste Erkenntnisse
Was ist 9Router?

9Router ist eine kostenlose Open-Source-lokale AI Proxy- und Token-Optimierungsgateway für Entwickler, die AI Programmierwerkzeuge Ähnlich wie Claude Code, Cursor, Codex, Cline und GitHub Copilot fungiert es als Schnittstelle zwischen Ihren CLI-Tools und über 40 Upstream-LLM-Anbietern und stellt einen einzigen OpenAI-kompatiblen Endpunkt unter localhost:20128/v1 bereit. Seine Kernfunktion besteht darin, durch Kontingentüberschreitung oder Ratenbegrenzungen verursachte Programmierausfälle mithilfe eines dreistufigen automatischen Fallback-Systems zu eliminieren, das von Premium-Abonnements über kostengünstige API-Stufen bis hin zu wirklich kostenlosen Anbietern reicht.
Zusätzlich zum Routing komprimiert der integrierte RTK Token Saver Tool-Ausgaben wie Git-Diffs und Log-Dumps, bevor diese den LLM erreichen. Dadurch werden die Kosten für Eingabe-Token bei jeder einzelnen Anfrage um 20 bis 40 Prozent gesenkt. Für Teams und Einzelentwickler, die genug von Unterbrechungen mitten in der Sitzung und explodierenden API-Rechnungen haben, ist 9Router die Infrastrukturschicht, die einen reibungslosen Codefluss nahezu kostenlos gewährleistet.

9Router's RTK (Rust Token Kompressor, portiert nach JavaScript) fängt jedes `tool_result` in Ihrer Eingabeaufforderung ab, bevor es an den LLM weitergeleitet wird. Es analysiert das erste Kilobyte der Daten, identifiziert den Inhaltstyp (Git-Diff, Log-Dump, Dateibaum, Grep-Ausgabe) und wendet gezielte, verlustfreie Filter an. Das Ergebnis sind 20 bis 40 Prozent weniger Eingabe-Token pro Anfrage – und das völlig ohne Kontextverlust. Falls ein Filter fehlschlägt oder die Ausgabegröße erhöht, verwirft RTK ihn stillschweigend, sodass Ihre Anfrage niemals abgebrochen wird.
Die Fallback-Engine ist das Herzstück von 9Router. Sie konfigurieren eine „Combo“, die bis zu fünf Modellstufen miteinander verknüpft: Ihr aktives Abonnement (z. B. Claude Code Pro für 20 $ pro Monat), eine günstige Alternative (z. B. GLM für 0.60 $ pro Million Token) und einen kostenlosen Anbieter mit unbegrenztem Datenvolumen (z. B. Kiro AI). Sobald ein Fehler aufgrund einer Ratenbegrenzung oder eines erschöpften Kontingents erkannt wird, fängt 9Router diesen im Hintergrund ab und leitet dieselbe Anfrage an die nächste Stufe weiter. Ihr Programmiertool bemerkt diesen Wechsel nicht.

Inspiriert von Julius Brussees viralem Aufruf „Warum viele Token verwenden, wenn wenige Token ausreichen?“, fügt Caveman Mode eine Systemanweisung ein, die den LLM zu einer knappen Antwort zwingt. reduzierte SpracheDer technische Inhalt der Antwort bleibt vollständig erhalten, unnötige Füllwörter werden jedoch entfernt, wodurch bis zu 65 Prozent weniger Ausgabetoken entstehen. Bei umfangreichen agentenbasierten Codierungs-Workflows kann dies allein einen erheblichen Teil der monatlichen API-Kosten einsparen.

9Router fungiert als universeller Protokollübersetzer. Ihr CLI-Tool sendet ein standardmäßiges Open-Protokoll.AI Eine JSON-Anfrage an localhost wird von 9Router entpackt, in das native Format des Zielanbieters (Claude, Gemini, Vertex, Kiro, Cursor) umstrukturiert, gesendet und anschließend die Antwort wieder in Open Source übersetzt.AI Formatieren Sie die Daten, bevor Sie sie an Ihr Tool übergeben. Das Ergebnis ist, dass Claude Code, Codex, Cline, Roo und 12 weitere unterstützte CLI-Tools alle über einen einzigen Konfigurationspunkt geleitet werden.
9Router's Das Dashboard liefert Live-Daten zum Tokenverbrauch, Countdown-Anzeigen (5 Stunden, täglich, wöchentlich) und Kostenschätzungen pro Modell. Dank Round-Robin-Verteilung für mehrere Konten pro Anbieter lässt sich die Last auf mehrere Konten verteilen, sodass ein Konto, das sein Limit erreicht, nicht den gesamten Stack lahmlegt. OAuth-Token werden automatisch im Hintergrund aktualisiert, sodass während aktiver Sitzungen keine manuelle Reauthentifizierung erforderlich ist.
9Router bietet erstklassigen Support für drei wirklich kostenlose Anbieter: Kiro AI (kostenlos unbegrenzt) Klaus 4.5, GLM-5, MiniMax via AWS/Google OAuth), OpenCode Free (keine Authentifizierung, Modelle werden automatisch abgerufen) und Vertex AI (300 US-Dollar Google Cloud-Guthaben für neue Konten). In Kombination mit RTK zahlt ein Entwickler, der nur den kostenlosen Tarif nutzt, genau 0 US-Dollar pro Monat und erhält dennoch Zugriff auf produktionsreife Modelle wie Claude Sonnet 4.5.
9Router-Preispläne
| Tier | Kosten (USD) | Was Sie erhalten |
|---|---|---|
| 9Router-Software | $ 0 für immer | Vollständiger Proxy, alle Funktionen, Open-Source-Lizenz MIT |
| Kostenlose Anbieter (Kiro, OpenCode) | $0 | Unlimited Claude 4.5, GLM-5, MiniMax, kein API-Schlüssel |
| Scheitelpunkt AI | 0 $ (neues GCP: 300 $ Guthaben) | Gemini 3 Pro, DeepSeek, GLM-5 über Google Cloud |
| Günstiges Backup (GLM-5.1) | 0.60 $ pro 1 Mio. Token | Tägliche Zurücksetzung, ideal für Overflow-Routing |
| Günstiges Backup (MiniMax M2.7) | 0.20 $ pro 1 Mio. Token | 5-Stunden-Reset, günstigste Option pro Token |
| Kimi K2.5 Flat | $ Pro Monat 9 | 10 Millionen Token monatlich zu 0.90 $ pro 1 Million effektiver Jahrespreis |
| Claude Code Pro/Max | 20 bis 200 US-Dollar pro Monat | Premium-Abonnement optimal genutzt durch 9Router |
| GitHub-Copilot | 10 bis 19 US-Dollar pro Monat | Um Modellflexibilität zu gewährleisten, wird die Route über MITM übertragen. |
Bereitstellungsflexibilität – Lokal, VPS, Docker
9Router ist nicht an einen einzelnen Rechner gebunden. Für geteilte Teams oder Remote-Workflows lässt es sich mit einem einfachen `npm run build && npm run start`-Prozess und einigen wenigen Umgebungsvariablen auf jedem VPS bereitstellen. Docker-Images werden sowohl auf Docker Hub (decolua/9router) als auch auf Docker veröffentlicht. GitHub Container-Registry für plattformübergreifende Linux/amd64- und Linux/arm64-Unterstützung.
Die Cloudflare-Tunnel-Integration ermöglicht es Remote-Tools wie Cursor auf einem Laptop, Datenverkehr über eine serverseitig gehostete 9Router-Instanz zu leiten, ohne Firewall-Ports öffnen zu müssen. Die SQLite-Datenbank speichert alle Anbieterkonfigurationen, Kombinationen und den Nutzungsverlauf über ein eingebundenes Volume.
Vor-und Nachteile
- Kostenlos und für immer, MIT-Lizenz.
- 20 bis 40 % Token-Einsparung durch RTK.
- 65%ige Reduzierung der Output-Token mit Caveman.
- 12 CLI-Tools werden nativ unterstützt.
- Echter, kostenloser Anbietersupport.
- Docker-, VPS- und Cloudflare-Bereitstellung möglich.
- Erfordert eine Node.js-Installation (nicht nur GUI-basiert).
- Kein Dashboard für Latenz-Benchmarking pro Modell.
- Einige kostenlose Anbieter (iFlow, Qwen) haben ihren Betrieb im Jahr 2026 eingestellt.
Die besten 9 Router-Alternativen
| AI Gateway / LLM-Router / Token-Speicher | Multi-Provider-Fallback | Tokenoptimierung |
|---|---|---|
| OmniRoute | 4-Tier-Architektur, über 36 Provider, TypeScript | Nur semantischer Cache |
| LiteLLM | Mehr als 100 Anbieter, Fokus auf Unternehmen | Keine eingebaute Kompression |
| OpenRouter | Cloudbasiert, keine lokale Installation erforderlich | Keine Token-Sparfunktionen |
| LobeChat-Gateway | Liste eingeschränkter Anbieter | Kein RTK-Äquivalent |
