Dieser Datensatz liefert realistische Token-Verbrauchsschätzungen für 64 gängige KI-Aufgaben in verschiedenen Kategorien, die in Unternehmens-Büroumgebungen häufig vorkommen: Kommunikation, Coding, Analyse, Planung, Dokumentenverarbeitung und multimodale Aufgaben (Vision, Audio, Mixed).

Über diesen Datensatz

Der Datensatz vergleicht den Token-Verbrauch zwischen Standard-Modellen (wie GPT-4o) und Reasoning-Modellen (wie OpenAI o1). Reasoning-Modelle nutzen zusätzliche versteckte Tokens, um Probleme Schritt für Schritt zu „durchdenken”, bevor sie Antworten generieren – was zu präziseren und zuverlässigeren Ergebnissen führt.

Dieser Datensatz wurde aus realen Anwendungsfällen in unseren Enterprise-KI-Implementierungsprojekten zusammengestellt und anschließend mit Daten aus den unten aufgeführten autoritativen Quellen validiert und erweitert. Die Token-Schätzungen spiegeln tatsächliche Produktions-Workloads wider und kann zur modellierung von theoretische Szenarien verwendet werden.

Zentrale Erkenntnisse:

  • Einfache Aufgaben (z.B. „Hello World”) nutzen ~300-500 zusätzliche Tokens für Reasoning
  • Komplexe Aufgaben (Mathe, Debugging, Logik) profitieren am meisten: Reasoning-Modelle nutzen 10-20x mehr Tokens, liefern aber deutlich bessere Genauigkeit
  • Multimodale Aufgaben (Bilder, Audio) haben hohe Basis-Kosten vor jeglichem Reasoning
  • Audio ist extrem token-dicht: ~1.000-1.200 Tokens pro Minute

Token-Verbrauch Datensatz

Der vollständige Datensatz ist verfügbar zum Download als CSV-Datei.

KategorieAufgabeBeschreibungInput-TokensOutput-Tokens (Normal)Output-Tokens (Reasoning)BilderAudio (Min)
KommunikationKurze E-Mail verfassenKrankmeldung an Chef schreiben5010045000
KommunikationHöfliche AbsageHochzeitseinladung höflich ablehnen6012050000
KommunikationTon anpassenAbsatz professioneller klingen lassen15015080000
KommunikationBewerbungsanschreibenAnschreiben für Vertriebsposition schreiben200400180000
KommunikationAuf SMS antworten3 witzige Antworten auf SMS geben406050000
KommunikationGrammatikprüfungGrammatik in 200-Wort-Memo korrigieren20015090000
CodingHello World ScriptPython Hello World Script schreiben302035000
CodingExcel-Formel-HilfeFormel für VLOOKUP Spalte A in Blatt 25050120000
CodingRegex-GenerierungRegex zur E-Mail-Validierung8070150000
CodingSQL-Query-GenerierungTop 5 User nach Ausgaben aus Tabellen selektieren100100180000
CodingCode debuggenFehler in 50-Zeilen Python-Funktion finden600200450000
CodingCode refactorenCode effizienter umschreiben700300500000
CodingError-Log erklärenWas bedeutet dieser Stack Trace?350150250000
AnalyseArtikel zusammenfassen1000-Wort-Artikel zusammenfassen1400200350000
AnalyseDaten extrahierenAlle Daten und Namen aus Text auflisten1000200280000
AnalyseMathe-TextaufgabeWenn Zug Chicago mit 60 mph verlässt…10050250000
AnalyseLogik-Rätsel lösenZwei-Türen-zwei-Wächter-Rätsel lösen12080200000
AnalyseFinanzanalyseCSV-Zeilen auf Trends analysieren600200350000
AnalyseSentiment-AnalyseIst Kunden-Review positiv?807060000
PlanungEssensplanGesunden 3-Tage-Essensplan erstellen150350150000
PlanungReise-Itinerary3-Tages-Wochenende in Tokyo planen200600250000
PlanungTitel brainstormen10 catchy Titel für KI-Blog10010080000
PlanungHaiku schreibenHaiku über Ozean schreiben303040000
PlanungGeschenk-IdeenGeschenkideen für Papa, der Golf mag100200100000
PlanungRollenspiel-SzenarioTu so, als wärst du Karriere-Coach150450150000
DokumentenverarbeitungRechnungsdaten extrahierenLieferant, Summe, Datum aus 2-seitiger Rechnung extrahieren900300280000
DokumentenverarbeitungVertrag zusammenfassenKernpunkte aus 10-seitigem Rechtsvertrag zusammenfassen4000500900000
DokumentenverarbeitungLebenslauf-ScreeningRelevante Skills aus 2-seitigem Lebenslauf extrahieren1100400320000
DokumentenverarbeitungDokument übersetzen5-seitiges spanisches Dokument ins Englische übersetzen2300700650000
DokumentenverarbeitungMarkdown formatieren500-Wort Word-Doc in strukturiertes Markdown konvertieren1200600400000
DokumentenverarbeitungJSON-Schema parsenFehlerhaftes JSON-Dokument validieren und reparieren500300220000
DokumentenverarbeitungCSV zu SQL100-Zeilen-CSV zu INSERT-Statements konvertieren1200800450000
DokumentenverarbeitungTabellendaten extrahierenTabelle aus PDF extrahieren und umstrukturieren (500 Zeilen)2800700700000
DokumentenverarbeitungVersionen vergleichenÄnderungen zwischen 2 Versionen eines 5-Seiten-Docs identifizieren1700500550000
DokumentenverarbeitungCode-PR reviewen200-Zeilen Code-Pull-Request auf Bugs reviewen1300500450000
DokumentenverarbeitungAPI-Docs generierenDokumentation aus 50-Funktionen-Sourcefile erstellen1800700550000
Multimodal (Vision)Bild beschreibenInhalt eines einzelnen Fotos beschreiben800150220010
Multimodal (Vision)OCR-DokumentText aus Bild handgeschriebener Notiz extrahieren850200240010
Multimodal (Vision)Diagramm analysierenDatentrends aus Balkendiagramm-Bild interpretieren950350300010
Multimodal (Vision)Screenshot-AnalyseUI aus Application-Screenshot debuggen900350380010
Multimodal (Vision)Objekte identifizierenAlle Objekte in Bild eines Lagers auflisten800300280010
Multimodal (Vision)Bilder vergleichenUnterschiede zwischen 2 Produktfotos finden1600600450020
Multimodal (Vision)Whiteboard lesenGleichung auf Whiteboard-Foto transkribieren800250260010
Multimodal (Audio)Audio transkribieren5-Minuten Audio-Interview transkribieren50008001100005
Multimodal (Audio)Meeting-Notizen extrahierenZusammenfassung und Action Items aus 30-Min-Meeting generieren30000100058000030
Multimodal (Audio)Speaker identifizierenSprecher und Emotion in 2-Min-Audio-Clip identifizieren2000300480002
Multimodal (Audio)Audio übersetzen10-Min deutsches Audio transkribieren und ins Englische übersetzen10000100021000010
Multimodal (Mixed)Dokument + BildTextdokument mit zugehörigen Fotos abgleichen15001000550020
Multimodal (Mixed)Video-BeschreibungInhalt aus 2-Min-Video beschreiben (Frames + Audio)23002200950032
Multimodal (Mixed)Multi-Bild-VergleichÄnderungen über 5 Produkt-Design-Mockups vergleichen4200600950050
Dokumentenverarbeitung50-Seiten Technical Report zusammenfassenKernerkenntnisse aus 50-seitigem technischem PDF ohne Bilder zusammenfassen2000012002600000
DokumentenverarbeitungKPIs aus 50-Seiten Jahresbericht extrahierenUmsatz, Gewinn und Wachstums-KPIs aus 50-Seiten-Jahresbericht extrahieren2200015002800000
Dokumentenverarbeitung100-Seiten Regulatory Filing zusammenfassenExecutive Summary von 100-Seiten Regulatory Filing (10-K/10-Q) erstellen4000020005200000
DokumentenverarbeitungZwei 50-Seiten-Verträge vergleichenUnterschiede und Risiken zwischen zwei 50-Seiten-Rechtsverträgen identifizieren3800025006000000
Dokumentenverarbeitung5k-Zeilen-Codebase-Datei auditieren5000-Zeilen-Code-Einzeldatei auf Bugs und Architektur-Probleme reviewen3500030007000000
Multimodal (Vision)20-Seiten gescanntes PDF verarbeitenOCR und Strukturierung von 20-seitigem gescanntem PDF (nur Bild)16000200030000200
Multimodal (Mixed)50-Seiten-Report mit Charts analysieren50-Seiten-PDF mit Text plus 10 Diagramm-Bildern zusammenfassen23000200032000100
Multimodal (Audio)60-Min-Podcast transkribierenVollständige Transkription einer 60-Minuten-Podcast-Episode60000300075000060
Multimodal (Audio)90-Min-Uni-Vorlesung zusammenfassenStrukturierte Notizen und Abschnitte aus 90-Minuten-Vorlesungsaufzeichnung generieren90000400090000090
Multimodal (Audio)2-Std-Support-Call-Log analysierenIssues, Sentiments und Eskalationspunkte aus 2-Std-Support-Call extrahieren12000050001100000120
Multimodal (Mixed)10-Min-Produkt-Demo-Video beschreibenFeatures und UX aus 10-Minuten-Demo-Video zusammenfassen (Screen + Narration)180003000220001010
Multimodal (Mixed)45-Min-Webinar mit Slides zusammenfassenStrukturierte Zusammenfassung aus 45-Min-Webinar-Audio plus 30 Slide-Bildern generieren750004000800003045
Multimodal (Mixed)60-Min-Überwachungskamera-Material reviewenSchlüsselereignisse in 60-Min-stiller Überwachungsaufzeichnung identifizieren48000250052000400

Datenquellen & Methodik

Dieser Datensatz wurde aus den folgenden autoritativen Quellen zusammengestellt:

Allgemeiner Tokenizer

  • Tiktokenizer (OpenAI): Standard-Text-Tokenisierungsregel: 1 Wort ≈ 1,3 Tokens (1000 Tokens ≈ 750 Wörter).

Reasoning-Modelle

  • OpenAI o1 System Card: Reasoning-Tokens sind versteckte Output-Tokens, die das Modell zum „Denken“ nutzt, bevor es antwortet. Können von Hunderten bis Zehntausenden reichen je nach Komplexität.
  • PromptLayer-Analyse (o1 vs GPT-4o): Reasoning-Modelle nutzen oft 3-10x mehr Tokens für komplexe Aufgaben wie Coding oder Mathe aufgrund interner Chain-of-Thought-Generierung.
  • Reddit Community-Analyse (Hidden Tokens): User-Benchmarks zeigen: Einfache Aufgaben nutzen ~300 versteckte Tokens, während komplexe Coding-Aufgaben 5.000+ versteckte Tokens übersteigen können.
  • Arxiv: Vergleichsstudie zu Reasoning-Patterns: Vergleichende Benchmarks zeigen: Reasoning-Modelle verbrauchen 10x-20x mehr Tokens bei komplexen Logik-Aufgaben.
  • Clarifai Reasoning-Modell-Vergleich: Benchmarks für harte Mathe-/Logik-Probleme zeigen: Reasoning-Token-Verbrauch überschreitet oft 30.000+ für schwierige Queries.
  • Databricks: Long Context RAG & o1: Hebt hervor, dass Reasoning-Modelle scheitern oder Output-Limits erreichen können bei sehr großen Kontexten (z.B. 100+ Seiten).

Vision-Aufgaben

  • OpenAI Vision-Dokumentation: Bilder werden in 512x512-Tiles verarbeitet. High-Detail-Modus kostet ~85 Tokens Basis + 170 Tokens pro Tile. Standard-1080p-Bild ist oft ~765-1105 Tokens.
  • Cursor IDE Blog (GPT-4o Bildkosten): Praktische Aufschlüsselung der Bildkosten: Low Detail ist fix bei 85 Tokens. High Detail skaliert mit Auflösung.

Audio-Aufgaben

  • OpenAI-Preise (Audio): Audio-Inputs werden separat von Text abgerechnet. GPT-4o Audio-Input ist ~€0,06/Min (Realtime).
  • Microsoft Azure AI Blog (Audio-Tokens): Audio-Tokenisierung ist dicht. Ca. 1 Minute Audio ≈ 1.000 - 1.200 Audio-Tokens für Abrechnungszwecke.
  • OpenAI GPT-4o Audio-Guide: Technische Details, wie Audio tokenisiert und verarbeitet wird, bestätigt die Unterscheidung zwischen Input-Audio-Tokens und Output-Text-Tokens.

Dokumentenverarbeitung

  • Arxiv: Chain of Draft: Diskutiert Token-Effizienz bei Reasoning-Modellen für Entwurfs- und Dokumentaufgaben, hebt Overhead von „Denk“-Schritten hervor.

Allgemeine Aufgaben


Anwendungsfälle

  • Kostenschätzung: Berechnen Sie erwartete API-Kosten für Ihre KI-Anwendungen
  • Modellauswahl: Wählen Sie zwischen Standard- und Reasoning-Modellen basierend auf Aufgabenkomplexität
  • Budgetierung: Planen Sie KI-Infrastrukturkosten für Produktions-Workloads
  • Forschung: Benchmarken und vergleichen Sie Token-Effizienz über verschiedene Aufgabentypen hinweg

Verwandte Ressourcen

Möchten Sie sehen, wie sich diese Aufgaben in reale Workloads übersetzen? Lesen Sie unsere detaillierte Analyse:

KI-Kosten nach Büro-Rolle - Wir nutzen diesen Datensatz, um typischen täglichen Token-Verbrauch für verschiedene Business-Rollen (Executive Assistant, Recruiter, Financial Analyst, Corporate Counsel, Software Engineer) zu berechnen und zeigen, was KI-Kosten in Ihrer Organisation treibt.


Zitation

Wenn Sie diesen Datensatz in Ihrer Forschung oder Anwendungen nutzen, zitieren Sie bitte:

onprem.ai Research (2025). Realer LLM-Token-Verbrauch: Datensatz.
Abgerufen von https://onprem.ai/de/knowhow/llm-token-usage-dataset/