# Warum das teuerste KI-Modell selten die klügste Wahl ist

> Unternehmen zahlen 12x mehr für 5% bessere KI-Ergebnisse. Was das Harvey-Experiment zeigt – und was Schweizer KMU konkret anders machen können.

**Author:** Patrik Breitenmoser
**Published:** 2026-06-20
**Tags:** KI-Strategie, KI-Kosten, KMU

---

Harvey ist ein KI-Unternehmen, das Anwältinnen und Anwälte mit KI-Assistenz ausstattet. Die haben kürzlich ein Experiment veröffentlicht, das mich beschäftigt.

Ausgangssituation: Harvey nutzte für alle Aufgaben das teuerste verfügbare Frontier-Modell. Hohe Qualität, hohe Kosten. Dann stellten sie um: günstigeres Open-Source-Modell für die Masse der Routinetasks, teures Premium-Modell nur für wirklich anspruchsvolle, hochriskante Fälle.

Ergebnis: Kosten tief. Qualität höher als vorher.

Beides. Gleichzeitig.

## Warum «immer das stärkste Modell» keine Strategie ist

Patrick O'Shaughnessy, Investor mit Fokus auf KI-Unternehmen, hat das so auf den Punkt gebracht: «Das teuerste Modell für jede Aufgabe einzusetzen, ist keine Qualitätsstrategie. Das ist Faulheit.»

Er hat recht.

Wer immer das stärkste Modell wählt, optimiert nicht. Er vermeidet das Nachdenken darüber, was eine Aufgabe wirklich braucht.

Nicht jede KI-Aufgabe braucht dieselbe Feuerkraft. Eine E-Mail-Zusammenfassung ist eine andere Anforderung als ein Vertrag, bei dem ein Fehler echten Schaden anrichtet.

Was stattdessen passiert: Teams zahlen 49 Cents pro Aufgabe für etwas, das 6 Cents gekostet hätte und gleich gut ausgefallen wäre. Das ist kein Sonderfall. Das ist die Regel.

Ein Ingenieur hat diese Woche dokumentiert: dasselbe Coding-Resultat mit Modell A für 1 Dollar, mit dem führenden Frontier-Modell für 12 Dollar. Das Frontier-Modell lieferte 5% bessere Ergebnisse. Bei 12-fachem Preis. Ob diese 5% zwölf Dollar statt einem wert sind, ist eine unternehmerische Entscheidung, keine technische.

## Was hinter diesem Muster steckt

Der Befund dieser Woche aus dem [AI Daily Brief](https://www.youtube.com/watch?v=4hvA6aCwf6E): Mehrere unabhängige Experimente kommen zum gleichen Schluss. Intelligente Aufgabenverteilung zwischen Modellen schlägt das stärkste Einzelmodell, bei Kosten und oft auch bei Qualität.

OpenRouter hat einen Ansatz entwickelt, bei dem Anfragen automatisch auf ein Panel von Modellen verteilt werden. Jedes Modell übernimmt, was es am besten kann. Ein Synthesizer-Modell fasst die Antworten zusammen. Ergebnis: bessere Qualität als ein Einzelmodell, tiefere Kosten.

Harvey geht einen ähnlichen Weg: ein günstiges Modell erledigt 80% des Volumens, das teure Modell übernimmt nur dort, wo es wirklich nötig ist. Das Kosten-Qualitäts-Verhältnis verbessert sich auf beiden Seiten gleichzeitig.

Das Prinzip hat einen Namen: Routing schlägt Brute Force.

## Was das für dein Unternehmen bedeutet

Wenn dein Team ChatGPT, Copilot oder ein vergleichbares KI-Tool täglich nutzt, stellt sich eine einfache Frage: Für welche Aufgaben setzt ihr eigentlich das Premium-Abo ein?

Die meisten Unternehmen, die ich in Workshops treffe, haben keine Antwort darauf. Das teuerste Modell läuft standardmässig, für alles, ohne je analysiert zu haben, was tatsächlich nötig ist. Oder KI wird noch gar nicht systematisch genutzt, was eine andere, aber ähnliche Kostenfrage aufwirft. Wer jetzt noch nicht systematisch eingestiegen ist, findet im [KI-Kickstart](/ki-kickstart) einen geordneten Einstieg.

Für alle, die bereits KI im Einsatz haben, sind drei Schritte sofort möglich:

**Aufgaben inventarisieren.** Listet auf, wofür euer Team KI täglich nutzt. Mails, Zusammenfassungen, Analysen, Code, Recherche? Schon dieses Inventar zeigt, wo das Volumen liegt und welche Aufgaben wirklich komplex sind.

**Risiko und Volumen trennen.** Hohes Volumen, tiefes Risiko: günstigeres Modell oder Basis-Plan. Tiefes Volumen, hohes Risiko: Premium-Modell gezielt einsetzen. Diese Trennung ist keine IT-Entscheidung. Sie ist eine kaufmännische.

**Preise konkret vergleichen.** Qualitätsunterschiede zwischen den führenden Modellen sind oft kleiner als die Preisunterschiede. Ein strukturierter Vergleich zeigt in ein paar Stunden, wo ihr zu viel bezahlt.

Das ist kein IT-Projekt. Das ist eine Entscheidung, die an einem halben Tag getroffen sein kann, und die sich sofort in der Monatsrechnung niederschlägt.

## Die eigentliche Frage

Das richtige Modell für die richtige Aufgabe zu wählen ist keine Technikfrage. Es ist eine Kosten-Nutzen-Frage, wie jede andere im Unternehmen.

Wer sie nicht stellt, zahlt zu viel. Und bekommt manchmal nicht einmal mehr dafür.

Die Evidenz dieser Woche ist eindeutig: Unternehmen, die nach Aufgabe und Risiko optimieren, verbessern Kosten und Qualität gleichzeitig. Nicht eines davon, sondern beides.

Willst du wissen, wie das konkret für dein Unternehmen aussehen könnte? In der [KI-Beratung](/ki-beratung) schauen wir uns gemeinsam an, welche KI-Tools ihr wirklich braucht und wo ihr zu viel bezahlt. Oder starte strukturiert mit dem [KI-Kickstart](/ki-kickstart).

[Kostenloses Gespräch buchen](/kontakt), 30 Minuten, unverbindlich, ohne Verkaufsdruck.