Labor

Probieren Sie's selbst aus.

Drei kleine Werkzeuge direkt im Browser — ohne Anmeldung, ohne Tracking. Sie zeigen exemplarisch, wie wir Open-Source-Bausteine zu schlanken Lösungen kombinieren.

KI-Kostenrechner — Cloud vs. On-Premise

Was kostet KI bei Ihrer Nutzung wirklich? Geben Sie Ihre Eckwerte ein und vergleichen Sie eine typische Cloud-API mit einem lokalen Llama-Server.

Mitarbeiter mit KI-Zugang

Anfragen pro Mitarbeiter & Tag

Ø Tokens pro Anfrage (Input + Output)

Cloud-Modell

Cloud-API (Monat)

–

verbrauchsabhängig, wächst linear mit jedem Mitarbeiter

On-Premise Llama-Server (Monat)
–
Hardware-Amortisation (€25.000 / 36 Monate) + Strom + Wartung — pauschal, unabhängig von Anfragen

Geben Sie Werte ein, um den Vergleich zu sehen.

Live-Token-Zähler

Tippen oder einfügen — der Text bleibt im Browser. Wir schätzen Tokens und Kosten pro Anfrage über mehrere Modelle.

Ihr Prompt oder Dokument

Zeichen

Wörter

~ Tokens

Modell	Kosten pro Anfrage	Bei 1.000 Anfragen
OpenAI GPT-4o	–	–
Claude Sonnet	–	–
Claude Haiku	–	–
On-Premise Llama 70B	€ 0,00	€ 0,00

Tokenzahlen sind eine Näherung (≈ 3,5 Zeichen pro Token für Deutsch). Echte Tokenizer unterscheiden sich zwischen Anbietern und Sprache.

Stack-Latenz-Probe

Klick startet 5 Pings gegen unseren FastAPI-Server. Damit sehen Sie, wie schnell ein lean gehaltener Python-Stack auf Linux antwortet — ohne PHP, ohne Apache, ohne Plugin-Ballast.

–ms (Ø)

Zum Vergleich: WordPress mit Apache + PHP + MariaDB liegt typisch bei 50–150 ms. Ein FastAPI-Endpoint im selben Netzsegment liefert üblicherweise unter 30 ms. Latenz alleine löst keine Probleme — aber sie ist ein guter Indikator für eine schlanke Architektur.

Spielzeug genug?

Diese Demos zeigen einen kleinen Ausschnitt. Was sich bei Ihnen automatisieren, lokal hosten oder messbar günstiger machen lässt, finden wir im Gespräch.

Termin anfragen

Open Source. On-Premise. Linux-nativ. Werkzeug, das verlässlich arbeitet, lizenzfrei läuft und Ihnen gehört.