Labor

Probieren Sie's selbst aus.

Drei kleine Werkzeuge direkt im Browser — ohne Anmeldung, ohne Tracking. Sie zeigen exemplarisch, wie wir Open-Source-Bausteine zu schlanken Lösungen kombinieren.

1

KI-Kostenrechner — Cloud vs. On-Premise

Was kostet KI bei Ihrer Nutzung wirklich? Geben Sie Ihre Eckwerte ein und vergleichen Sie eine typische Cloud-API mit einem lokalen Llama-Server.

Cloud-API (Monat)
verbrauchsabhängig, wächst linear mit jedem Mitarbeiter
On-Premise Llama-Server (Monat)
Hardware-Amortisation (€25.000 / 36 Monate) + Strom + Wartung — pauschal, unabhängig von Anfragen
Geben Sie Werte ein, um den Vergleich zu sehen.
2

Live-Token-Zähler

Tippen oder einfügen — der Text bleibt im Browser. Wir schätzen Tokens und Kosten pro Anfrage über mehrere Modelle.

0
Zeichen
0
Wörter
0
~ Tokens
ModellKosten pro AnfrageBei 1.000 Anfragen
OpenAI GPT-4o
Claude Sonnet
Claude Haiku
On-Premise Llama 70B€ 0,00€ 0,00
Tokenzahlen sind eine Näherung (≈ 3,5 Zeichen pro Token für Deutsch). Echte Tokenizer unterscheiden sich zwischen Anbietern und Sprache.
3

Stack-Latenz-Probe

Klick startet 5 Pings gegen unseren FastAPI-Server. Damit sehen Sie, wie schnell ein lean gehaltener Python-Stack auf Linux antwortet — ohne PHP, ohne Apache, ohne Plugin-Ballast.

ms (Ø)

Zum Vergleich: WordPress mit Apache + PHP + MariaDB liegt typisch bei 50–150 ms. Ein FastAPI-Endpoint im selben Netzsegment liefert üblicherweise unter 30 ms. Latenz alleine löst keine Probleme — aber sie ist ein guter Indikator für eine schlanke Architektur.

Spielzeug genug?

Diese Demos zeigen einen kleinen Ausschnitt. Was sich bei Ihnen automatisieren, lokal hosten oder messbar günstiger machen lässt, finden wir im Gespräch.

Termin anfragen

Open Source. On-Premise. Linux-nativ. Werkzeug, das verlässlich arbeitet, lizenzfrei läuft und Ihnen gehört.