Drei kleine Werkzeuge direkt im Browser — ohne Anmeldung, ohne Tracking. Sie zeigen exemplarisch, wie wir Open-Source-Bausteine zu schlanken Lösungen kombinieren.
Was kostet KI bei Ihrer Nutzung wirklich? Geben Sie Ihre Eckwerte ein und vergleichen Sie eine typische Cloud-API mit einem lokalen Llama-Server.
Tippen oder einfügen — der Text bleibt im Browser. Wir schätzen Tokens und Kosten pro Anfrage über mehrere Modelle.
| Modell | Kosten pro Anfrage | Bei 1.000 Anfragen |
|---|---|---|
| OpenAI GPT-4o | – | – |
| Claude Sonnet | – | – |
| Claude Haiku | – | – |
| On-Premise Llama 70B | € 0,00 | € 0,00 |
Klick startet 5 Pings gegen unseren FastAPI-Server. Damit sehen Sie, wie schnell ein lean gehaltener Python-Stack auf Linux antwortet — ohne PHP, ohne Apache, ohne Plugin-Ballast.
Zum Vergleich: WordPress mit Apache + PHP + MariaDB liegt typisch bei 50–150 ms. Ein FastAPI-Endpoint im selben Netzsegment liefert üblicherweise unter 30 ms. Latenz alleine löst keine Probleme — aber sie ist ein guter Indikator für eine schlanke Architektur.
Diese Demos zeigen einen kleinen Ausschnitt. Was sich bei Ihnen automatisieren, lokal hosten oder messbar günstiger machen lässt, finden wir im Gespräch.
Termin anfragenOpen Source. On-Premise. Linux-nativ. Werkzeug, das verlässlich arbeitet, lizenzfrei läuft und Ihnen gehört.