KI Use Cases #4

Meeting-Protokolle in Minuten, ohne dass dein Audio die Firma verlässt

Nach jedem Meeting dasselbe Spiel: Jemand muss das Protokoll schreiben. Meistens passiert es zu spät, lückenhaft oder gar nicht, und genau die Entscheidungen, die wichtig waren, gehen unter.

Es geht in wenigen Minuten: Meeting aufnehmen, das Audio lokal in Text umwandeln, und Claude baut daraus ein sauberes Protokoll mit Entscheidungen, To-dos und offenen Punkten. Der entscheidende Unterschied zu den üblichen Meeting-Bots: Deine Aufnahme verlässt deinen Rechner nie.

Warum nicht einfach ein Meeting-Bot?

Tools wie Otter oder Fireflies sind bequem, aber sie laden die Aufnahme auf fremde, oft US-amerikanische Server. Sprachaufnahmen gelten nach Art. 9 DSGVO als biometrische Daten und fallen damit in die höchste Schutzklasse. Mehrere deutsche Datenschutzbehörden haben ausdrücklich davon abgeraten, solche Cloud-Dienste für sensible Inhalte zu nutzen.

Wo dein Meeting-Audio wirklich landet: Cloud-Tools laden hoch, lokal bleibt es auf dem Gerät.

Die Alternative steckt im selben Modell, das auch unter vielen dieser Dienste läuft: Whisper, das quelloffene Spracherkennungsmodell von OpenAI. Nur lässt du es diesmal direkt auf deinem eigenen Rechner laufen, ohne dass ein einziges Audio-Byte das Gerät verlässt.

Der Ablauf in drei Schritten

Aufnehmen, lokal transkribieren, von Claude strukturieren lassen. Mehr ist es nicht.

Der ganze Ablauf auf einen Blick: aufnehmen, lokal transkribieren, Protokoll von Claude.

Schritt 1: Das Meeting aufnehmen

Du brauchst nur eine Audiodatei. Für ein Gespräch im Raum reicht die Sprachmemo-App am Handy oder eine beliebige Aufnahme-App am Laptop. Für Online-Meetings kannst du in Zoom oder Teams lokal aufzeichnen. Alternativ nehmen die Transkriptions-Apps aus Schritt 2 den System-Ton direkt mit auf.

Kurz, aber wichtig: Nimm Gespräche nur mit dem Einverständnis der Teilnehmenden auf. Ein kurzer Hinweis zu Beginn genügt und gehört ohnehin zum guten Ton.

Am Ende hast du eine Datei, meist als MP3, M4A oder WAV. Damit geht es weiter.

Schritt 2: Lokal in Text umwandeln

Du musst Whisper nicht selbst über die Kommandozeile bedienen. Dafür gibt es bequeme Apps, die das Modell auf deinem Rechner laufen lassen.

Auf dem Mac: MacWhisper

MacWhisper ist der einfachste Weg: App laden, Audiodatei per Drag-and-drop hineinziehen, als Sprache Deutsch wählen, Modell auswählen, und der Text steht zum Kopieren bereit. Die gesamte Transkription läuft auf dem Gerät, nichts wird hochgeladen. Die Free-Version deckt die kleineren Modelle ab; für die besten deutschen Ergebnisse und die Sprecher-Erkennung gibt es die Pro-Version als einmaligen Kauf, ohne Abo.

Auf Windows (und Mac/Linux): Vibe oder Buzz

Zwei kostenlose, quelloffene Apps machen dasselbe: Datei importieren, Modell wählen, transkribieren, als TXT exportieren, komplett offline. Vibe wirkt etwas moderner, läuft auf Windows, Mac und Linux und bringt eine Sprecher-Trennung mit; Buzz ist die ebenso solide Alternative. Zwei Hinweise dazu: Lade beide nur aus dem offiziellen Repo, nicht von Spiegelseiten. Und beim ersten Start warnt Windows, weil die Installer nicht signiert sind. Bei Open-Source-Apps ist das völlig normal; klick einfach auf „Weitere Informationen” und dann „Trotzdem ausführen”.

Modell-Tipp: Für deutsches Business-Deutsch ist das medium-Modell der beste Kompromiss. Das große large-v3 bringt nur wenig mehr Genauigkeit, braucht aber deutlich mehr Zeit und Arbeitsspeicher. Die kleinen Modelle sind schnell, verschlucken aber öfter Fachbegriffe.

Fürs ganze Team: selbst hosten

Wer das nicht auf jedem Rechner einzeln einrichten will, stellt Whisper einmal zentral auf einen eigenen Server oder einen Büro-PC. Das Team lädt sein Audio dann über eine Weboberfläche im Browser hoch. So bleibt die Aufnahme komplett im Firmennetz, ganz ohne Installation pro Person. Ein fertiges Docker-Paket wie Whishper oder die faster-whisper-Engine ist in wenigen Minuten aufgesetzt: Modell auf medium, Sprache Deutsch, fertig. Das braucht etwas IT-Hand und läuft wahlweise auf einem deutschen bzw. EU-Server oder direkt im Haus. Eine GPU beschleunigt deutlich; auf reiner CPU dauert die Transkription grob in Echtzeit.

Heraus kommt ein Block Text, das Roh-Transkript. Oft ohne saubere Zeichensetzung und ohne getrennte Sprecher. Das macht nichts: Den Rest erledigt Claude.

Schritt 3: Claude baut das Protokoll

Öffne Claude, füge das Transkript ein und stell diesen Prompt davor. Er zieht Entscheidungen, To-dos mit Verantwortlichen und Fristen sowie offene Punkte heraus, und er ist bewusst so gebaut, dass Claude nichts dazuerfindet.

Prompt · zum Kopieren in Claude

Du bist mein Protokoll-Assistent. Unten steht das Roh-Transkript eines Meetings. Erstelle daraus ein knappes, sachliches Protokoll auf Deutsch mit genau diesen Abschnitten:

1. Kurzzusammenfassung (max. 3 Sätze)
2. Entscheidungen: was wurde verbindlich beschlossen?
3. To-dos als Liste, je Eintrag: Aufgabe, verantwortliche Person, Frist (falls genannt)
4. Offene Punkte: ungeklärte Fragen oder vertagte Themen

Regeln:
- Nutze nur Informationen aus dem Transkript. Erfinde nichts.
- Fehlt etwas (z. B. Name oder Frist), schreibe „unklar" statt zu raten.
- Formuliere knapp und neutral, ohne Füllwörter.

Hier ist das Transkript:
[TRANSKRIPT HIER EINFÜGEN]

Aus dem chaotischen Mitschnitt wird so ein strukturiertes Protokoll, das man tatsächlich verschicken kann:

Aus dem Roh-Transkript wird ein sauberes Protokoll mit Entscheidungen, To-dos und offenen Punkten.

Immer kurz gegenlesen: Whisper verhört sich gern bei Eigennamen, Abkürzungen und Fachbegriffen. Ein schneller Blick auf Namen und Fristen, bevor das Protokoll rausgeht, spart später Rückfragen.

Wo die Grenzen liegen

Bleiben wir genau: Das Audio bleibt bei diesem Weg auf deinem Rechner. Der Text, den du in Schritt 3 einfügst, geht aber zu Claude in die Cloud. Der Gewinn heißt also „die Stimme bleibt im Haus”, nicht „alles bleibt im Haus”. Bei heiklen Runden lohnt es sich, Namen und Personendaten im Transkript vorher zu anonymisieren (etwa „Person A”, „Person B”), bevor der Text an Claude geht.

Wer selbst hostet (siehe oben), kann sogar den Protokoll-Schritt im Haus behalten: Whisper lokal plus ein lokales Sprachmodell statt Claude, etwa über Ollama. Dann verlässt kein einziges Byte das Firmennetz, allerdings bei spürbar geringerer Protokoll-Qualität. Das ist die Stufe für die wirklich heiklen Runden.

Auch sonst gilt: Die automatische Sprecher-Trennung ist der wackeligste Teil. Bei vielen Stimmen oder schlechtem Ton verwechselt sie schon mal, wer was gesagt hat. Und für juristisch wortgenaue Mitschnitte ist das nichts; dafür gibt es spezialisierte Dienste.

Wer auch den Text-Schritt in der EU halten will: In einer Plattform wie ConRat AI lässt sich pro Modell auswählen, wo es läuft: auf Microsoft Azure oder Google Vertex mit Serverstandort Deutschland bzw. EU. Du siehst dabei transparent, welches Modell wo gehostet ist. Dann bleibt nicht nur die Stimme, sondern auch der Text in der EU.

KI im Unternehmen, ohne Bastelei

Wer das nicht für jedes Tool einzeln einrichten will, sondern KI-Werkzeuge gebündelt und datenschutzkonform an einem Ort braucht, schaut sich ConRat AI an. Lernen, anwenden, automatisieren, alles in einer Plattform.

ConRat-AI 30 Tage kostenlos testen