Zum Inhalt springen
KI Use Cases #1

PDFs richtig an KI füttern: weniger Tokens, bessere Antworten

KI Use Cases #1

Fast jeder Unternehmer zieht seine PDFs direkt in ChatGPT. Damit verschenkt man Rechenleistung, Geld und Genauigkeit. Hier erfährst du, warum das passiert und wie du es mit einem kostenlosen Werkzeug in wenigen Minuten löst.

Der Fehler, den fast jeder macht

Du lädst ein PDF in eine KI und glaubst, sie liest einfach deinen Inhalt. Tatsächlich bekommt das Modell viel mehr als nur deinen Text. Es schluckt den ganzen unsichtbaren Ballast mit: Formatierungs-Codes, Layout-Informationen, eingebettete Schriften und Bilder ohne ein einziges nützliches Wort.

Ein großer Teil der verarbeiteten Tokens entfällt auf diesen Müll statt auf deinen eigentlichen Inhalt. Tokens sind die Einheit, in der KI-Modelle Text verarbeiten und abrechnen. Je mehr Ballast, desto teurer und desto unschärfer das Ergebnis.

Beispielhafte Darstellung: ein erheblicher Teil der Tokens entfällt auf Formatierung, nicht auf den Inhalt.

Der Unterschied in Zahlen

Nimm denselben Geschäftsbericht einmal als rohes PDF und einmal als aufgeräumten Text. Der Inhalt ist identisch, der Aufwand für die KI ist es nicht. Sauberer Text braucht spürbar weniger Tokens für genau dieselbe Aussage. Unabhängige Tests aus dem Jahr 2026 nennen grob ein Drittel bis die Hälfte weniger Tokens, je nach Dokument.

Veranschaulichung mit Beispielwerten. Die konkreten Zahlen hängen vom Dokument ab.

Weniger Tokens bedeuten dreierlei: Es kostet weniger, die Antwort kommt schneller, und sie wird präziser, weil das Modell nicht durch Formatierungs-Rauschen abgelenkt wird.

Die Lösung: MarkItDown von Microsoft

MarkItDown ist ein kostenloses, quelloffenes Werkzeug von Microsoft. Es wandelt PDFs, Word, Excel und weitere Formate in sauberes, reines Markdown um. Also genau in die strukturierte Textform, die KI-Modelle am besten verstehen, ganz ohne Formatierungs-Wust und versteckte Daten.

Wichtig für deinen DatenschutzEs kursieren viele Web-Seiten, auf denen man ein PDF einfach hochlädt. Das sind inoffizielle Dritt-Angebote. Wer dort ein Dokument hochlädt, schickt seine Daten auf einen fremden Server. Für alles mit Kundendaten ist das keine Option. Die saubere Lösung läuft lokal auf deinem eigenen Rechner.

Anleitung: PDF in sauberen Text umwandeln

Je nachdem, wie technisch du arbeitest und wie sensibel deine Dokumente sind, gibt es drei Wege.

Nur unkritischWeg 1: schnell, ohne Installation

1

Web-Konverter nutzen

Es gibt browserbasierte Konverter, in die du das Dokument lädst und sofort sauberen Text zurückbekommst. Der wichtige Unterschied liegt darin, wo die Datei verarbeitet wird:

pdfmarkdown.app verarbeitet die Datei nach Anbieterangabe direkt im Browser, sie bleibt also auf deinem Gerät. Das ist die datenschutzfreundlichste der Web-Optionen. markitdown.online und markitdown.tech dagegen laden die Datei auf einen Server hoch.

Für alle Web-Konverter gilt: nur für Dokumente ohne sensible Inhalte, etwa öffentliche Texte oder eigene Notizen. Niemals für Kundendaten, Verträge oder Personaldaten. Wer auf Nummer sicher gehen will, nimmt Weg 2.

EmpfohlenWeg 2: lokal und datenschutzkonform

Einmal eingerichtet, bleibt jedes Dokument auf deinem Rechner. Das ist der richtige Weg für alles Geschäftliche.

1

Python installieren

Falls noch nicht vorhanden, lade Python von der offiziellen Seite python.org und installiere es.

2

MarkItDown installieren

Öffne die Kommandozeile und gib ein:

pip install markitdown[all]

Das offizielle Tool von Microsoft findest du auf github.com/microsoft/markitdown.

3

Dokument umwandeln

Wandle dein PDF in eine saubere Textdatei um:

markitdown bericht.pdf -o bericht.md
4

In die KI laden

Gib der KI die erzeugte bericht.md statt des PDFs. Du wirst den Unterschied in Geschwindigkeit und Genauigkeit sofort merken.

Für ProfisWeg 3: direkt in Claude Desktop oder VS Code

1

Als MCP-Server anbinden

MarkItDown lässt sich als sogenannter MCP-Server direkt mit Claude Desktop verbinden. Dann wandelt die KI das Dokument bei Bedarf selbst um, ohne dass du einen Zwischenschritt machst. Der eleganteste Weg, wenn du ohnehin täglich mit KI arbeitest.

2

Oder per Klick in VS Code

Wer mit VS Code arbeitet, installiert die MarkItDown-Erweiterung und wandelt Dateien mit einem Klick um. Läuft lokal, ohne Kommandozeile.

Ehrlich gesagtMarkItDown ist stark bei Text, stößt aber bei stark verschachtelten Tabellen an Grenzen; dafür gibt es ausgefeiltere Werkzeuge. Zwei Dinge solltest du außerdem wissen: Im rein lokalen Standardbetrieb verarbeitet MarkItDown keine Bilder und macht kein OCR. Ein gescanntes oder reines Bild-PDF ohne echte Textebene liefert also nichts. Bildinhalte kann MarkItDown nur mit angebundenem KI-Modell auslesen oder beschreiben, dann verlassen diese Daten aber den Rechner und es entstehen Kosten. Für den Alltag mit Berichten, Angeboten und textbasierten Dokumenten bleibt MarkItDown genau richtig und vollständig lokal.

Warum das funktioniert

Die Logik dahinter ist einfach. Weniger Ballast lässt die KI fokussierter arbeiten, und fokussierte Arbeit führt zu einem besseren Ergebnis.


KI im Unternehmen, ohne Bastelei

Wer das nicht für jedes Tool einzeln einrichten will, sondern KI-Werkzeuge gebündelt und datenschutzkonform an einem Ort braucht, schaut sich ConRat AI an. Lernen, anwenden, automatisieren, alles in einer Plattform.

ConRat-AI 30 Tage kostenlos testen
WordPress Cookie Hinweis von Real Cookie Banner