Anleitung

Spracheingabe für AI Coding: Cursor und Claude Code per Sprach-Prompt ohne Tippen

Vibe Coding geht schneller, wenn du die Änderung beschreiben kannst, statt sie zu tippen. Sechs ausgearbeitete Beispiele, die Prompt-Muster, auf die wir uns eingependelt haben, und wie du mit mehrsprachigen Bezeichnern umgehst.

Shuran Zhou, Founder · 2026-03-15 ·9 Min. ·Aktualisiert 2026-03-15

TL;DR

Wenn du suchst, wie man Cursor per Sprach-Prompt bedient — oder wie man Claude Code Diktat richtig hinbekommt, ohne jeden Bezeichner zu buchstabieren — ist das hier der praktische Leitfaden. Spracheingabe für AI Coding funktioniert, weil Prompts überwiegend Prosa sind: Kontext, Absicht, Einschränkungen und Test-Erwartungen. Loqua ergänzt das um multimodalen Bildschirmkontext, strukturierte Prompt-Formatierung, Umgang mit technischem Vokabular und das Mischen von EN+Chinesisch mitten im Satz. Der Vibe-Coding-Workflow per Sprache, der sich am meisten auszahlt: lange Cursor-Prompts, Debugging in Claude Code, Refactor-Specs und Testbeschreibungen. Kurze „Fix das"-Prompts sind per Sprache oft nicht schneller; der Gewinn liegt in dichten Anweisungen.

Loqua ist eine kontextbewusste Spracheingabe für Mac, die sieht, woran du arbeitest, und die Ausgabe entsprechend formt. Für AI Coding heißt das konkret: Loqua erkennt das Chat-Panel von Cursor, das Terminal von Claude Code, die Prompt-Box von ChatGPT und erzeugt Prompts in der Struktur, die diese Tools am besten verarbeiten.

Das ist kein Produktivitäts-Listicle. Wir nutzen Sprache täglich für unser eigenes AI Coding und halbieren bei langen Anweisungen die Zeit fürs Prompt-Schreiben in etwa — dort ist der Gewinn am größten. Kurze Prompts („Fix das") sind ein Wash. Lange, strukturierte Prompts (Refactor-Specs, Änderungen über mehrere Dateien, Debug-Erzählungen) sind das Feld, in dem sich Sprache auszahlt.

Warum Sprache zu AI Coding passt

Die Form eines AI-Coding-Prompts unterscheidet sich von der Form von Code. Ein guter Prompt hat: einen Kontextblock (wo ich bin, was ich sehe, was ich gerade probiert habe), einen Anweisungsblock (was ich erledigt haben will) und Einschränkungen (X nicht ändern, Y bewahren, Z-Tests müssen bestehen). Das ist Prosa, keine Syntax — und Prosa ist genau das, worin Sprache stark ist.

Du denkst schneller, als du tippst — bei Prosa locker doppelt so schnell. Der Engpass ist nicht dein mentales Modell, sondern die Tastenanschlag-Steuer. Für Prompts, die einem LLM eine komplexe Situation erklären, ist diese Lücke entscheidend. Loqua legt drei Dinge auf das einfache Diktat obendrauf: Es sieht den Zustand deiner IDE (sodass sich Kontextblöcke von selbst schreiben), es formatiert Prompts strukturell (System + User oder als Aufzählung mit Schritten) und es geht mit technischem Vokabular um, ohne dass du Bezeichner buchstabieren musst.

Setup für AI Coding

Dieser Abschnitt setzt voraus, dass Loqua installiert ist (siehe unseren Setup-Guide zum Diktieren von Code auf dem Mac). Die einzige AI-Coding-spezifische Konfiguration ist, Loqua die Accessibility-Berechtigung zu erteilen, damit es die Selektion und den umliegenden Text der aktiven App lesen kann. Die macOS-Accessibility ist auf developer.apple.com dokumentiert; es ist dieselbe API, die Screenreader und Automatisierungs-Tools nutzen.

Drei Gewohnheiten zum Aufbauen:

Vor dem Diktieren auswählen. Wenn der Prompt auf einen bestimmten Block wirken soll, wähle ihn vorher aus. Loqua reicht die Selektion als Kontext weiter.
Das Chat-Panel inline öffnen. In Cursor signalisiert das sichtbare Chat-Panel Loqua, dass du promptest, nicht editierst.
Pausen für strukturelle Brüche. Eine halbe Sekunde Pause wird als Absatzumbruch im Prompt gelesen — nützlich, um Kontext von Anweisung zu trennen.

Prompt-Strukturen, die funktionieren

Nach Monaten des Sprach-Promptens haben wir uns auf drei Strukturen eingependelt, die das sauberste LLM-Verhalten erzeugen. Loqua liest, wie du den Beginn einer Äußerung rahmst, und formt die Ausgabe entsprechend.

Einleitung, die du zuerst sagst	Form der Ausgabe
„Refaktoriere das so…"	Refactor: [Ziel]. Einschränkungen: [implizit aus der Selektion]. Output: [Code].
„Debugge das — wenn ich X mache, passiert Y, ich habe aber Z erwartet"	Erzählerischer Bug-Report mit Schritten, Erwartetem und Tatsächlichem.
„Schreib eine Spec für…"	Strukturierte Spec: Ziel / Inputs / Outputs / Randfälle / Tests.
„Füge einen Test hinzu, der…"	Testbeschreibung + Akzeptanzkriterien.
„Erkläre, warum dieser Code…"	Reine Prosa, technisches Register.

Sechs ausgearbeitete Beispiele

Du sagst (Cursor, mit ausgewählter Funktion)

„refaktoriere das so, dass der neue Auth-Client genutzt wird, und entferne den Legacy-Fallback, der sonst nirgends mehr verwendet wird"

Loqua schreibt (in Cursor chat)

Refaktoriere die ausgewählte Funktion, sodass der neue AuthClient genutzt wird. Entferne den Legacy-Fallback-Pfad — bestätigt nicht woanders im Codebase verwendet. Bewahre die öffentliche Funktionssignatur.

Du sagst (Debugging in Claude Code)

„wenn ich den Search-Endpoint mit einem leeren Query aufrufe, bekomme ich eine 500 statt eines leeren Arrays, ich hätte erwartet, dass der Leerfall sauber behandelt wird"

Loqua schreibt (im Claude Code Terminal)

Debug: Search-Endpoint liefert 500 bei leerem Query.

Schritte:
1. POST /search mit Body { "query": "" }
2. Server antwortet mit 500 (erwartet: 200 mit leerem Array)

Hypothese: Der Pfad für leere Strings überspringt das Early-Return und trifft den Indexer mit einem ungültigen Query.

Fix: Early Return für leere Queries hinzufügen.

Du sagst (Spec für ein neues Feature)

„Spec für ein Feature gespeicherte Suchen, Nutzer können eine Suche speichern und später wieder laden, es soll geräteübergreifend synchronisieren und per Name abfragbar sein"

Loqua schreibt (in Cursor, Planungsdokument)

## Spec: Gespeicherte Suchen

**Ziel:** Nutzer speichern eine Suchanfrage und laden sie später erneut.

**Inputs:** Suchanfrage (String), User-ID, optionaler Name (String, Default: erste N Zeichen der Anfrage).

**Verhalten:**
- In die Saved-Searches-Collection des Nutzers persistieren.
- Geräteübergreifend über bestehende User-Data-Sync synchronisieren.
- Per Name abfragbar (Substring-Match, Groß-/Kleinschreibung egal).

**Randfälle:** doppelte Namen → Suffix mit Index; gelöschter Nutzer → Cascade Delete.

Du sagst (Anfrage für einen Test)

„füge einen Test hinzu, der prüft, dass der Rate Limiter die elfte Anfrage in einem Ein-Minuten-Fenster blockiert und eine 429 mit Retry-After-Header zurückgibt"

Loqua schreibt (in Claude Code)

Test für den Rate Limiter ergänzen:
- 10 Anfragen innerhalb eines 60-Sekunden-Fensters senden — alle erfolgreich.
- Die 11. Anfrage muss 429 zurückgeben.
- Die Antwort muss einen Retry-After-Header mit dem Wert „verbleibende Sekunden" enthalten.
- Bestehende Test-Fixtures zur Zeitsteuerung verwenden.

Du sagst (Multi-File-Refactor)

„zerlege den User-Controller in separate Dateien für Auth, Profile und Preferences, behalte die bestehende öffentliche API und aktualisiere den Router"

Loqua schreibt (in Cursor chat)

Refactor: userController.ts in drei Module aufspalten — authController, profileController, preferencesController. Die öffentliche API-Oberfläche unverändert lassen. Den Router so anpassen, dass er aus den neuen Pfaden importiert. Keine Verhaltensänderungen; das ist ein rein struktureller Refactor.

Du sagst (Kurswechsel mitten in der Aufgabe)

„eigentlich, bevor wir refaktorisieren, füge einen Regressionstest hinzu, der das aktuelle Verhalten der Merge-Funktion abdeckt, damit wir später Drift erkennen können"

Loqua schreibt (in Claude Code)

Vor dem Refactor: einen Regressionstest hinzufügen, der das aktuelle Verhalten der merge-Funktion abdeckt. Der Test soll die bestehenden Outputs als Snapshot festhalten, damit wir jede Drift erkennen können, die der Refactor einführt.

Loqua den Dateikontext sehen lassen

Wenn du „refaktoriere das" ohne Selektion sagst, sendet Loqua nur die Anweisung. Sobald Text ausgewählt ist, fügt Loqua vor der Anweisung einen kurzen Kontextblock ein, der das Ausgewählte beschreibt — Dateiname, Zeilen, umliegende Bezeichner. Du musst den Kontext nicht diktieren; die multimodale Schicht liest ihn aus.

Das ist wichtig für KI-Tools, die von explizitem Kontext profitieren (Claude Code profitiert besonders von Dateipfaden und Zeilennummern). Loqua's Omni-Modal-Stack macht das möglich — wenn du die Intuition auf Forschungsebene willst, siehe den ausführlicheren Beitrag Voice trifft Vision: omni-modale Spracheingabe.

EN+中 mitten im Satz

Viele Diskussionen in unserem Engineering-Team finden auf Mandarin statt, mit eingestreuten englischen Fachbegriffen. KI-Tools in diesem Register per Sprache zu prompten ist Alltagsbeschäftigung. Loqua handhabt das Code-Switching ohne Modus-Umschaltung:

Du sagst (im Cursor-Chat)

„那个 cache invalidation 的逻辑要重构现在 race condition 太多了边界 case 经常漏"

Loqua schreibt (als Cursor-Prompt)

那个 cache invalidation 的逻辑要重构 —— 现在 race condition 太多了，边界 case 经常漏。请帮我重新设计 invalidation 策略：列出 race-condition 风险点，给出建议的同步原语方案，覆盖典型边界 case。

Tool-übergreifende Nutzung

Dieselbe gesprochene Phrase, in unterschiedliche KI-Tools diktiert, ergibt passend unterschiedliche Prompts. Wir formulieren nicht um — Loqua tut es:

Tool	Prompt-Form, die Loqua erzeugt
Cursor (Chat-Panel)	Konversationale Anweisung mit implizitem Dateikontext
Claude Code (Terminal)	Strukturierte Anweisung mit expliziten Dateipfaden und kurzem Plan
ChatGPT (Web)	Markdown-formatierter Prompt mit Abschnitten
Aider (Terminal)	Direkte Datei-Edit-Anweisung mit Zielpfaden

Du schreibst einmal mit deiner Stimme; Loqua formt es je Ziel um.

Stolperfallen

Diktiere Code nicht Buchstabe für Buchstabe. Sprache ist für den Prosa-Teil des Prompts; das LLM soll den Code erzeugen. Code Zeichen für Zeichen zu diktieren verfehlt den Sinn.
Selektion zählt. Wenn Loqua ausgewählten Code als Kontext mitnehmen soll, wähle ihn vor dem Diktieren aus. Sonst geht nur die Anweisung raus.
Lange Pausen beenden das Diktat. 1,5 Sekunden Stille werden als Ende der Äußerung gelesen. Wenn du mitten im Satz nachdenkst, nutze ein Füllwort — Loqua entfernt Füllwörter aus der Ausgabe, lässt aber die Aufnahme offen.
Der Zustand des Chat-Panels von Cursor zählt. Ist das Panel nicht sichtbar, behandelt Loqua dein Diktat eventuell als Code-Edit statt als Prompt. Öffne das Panel zuerst.
Diktiere Bezeichner nicht blind. Wenn du einen eigenen, nicht gebräuchlichen Bibliotheksnamen hast, trage ihn in den Einstellungen ins persönliche Wörterbuch ein oder sprich ihn als ein Wort aus.

Aggregierter Effekt: Bei langen Anweisungen halbiert sich die Zeit fürs Prompt-Schreiben ungefähr, und die Prompts selbst werden besser, weil die Sprachform dazu zwingt, Absicht zu erklären, statt nur die Änderung zu benennen. Das ist der Teil, der mehr zählt als reine Geschwindigkeit. Mehr zum übergeordneten Voice-AI-Coding-Muster — Sprach-Prompt-Flows in Cursor, Diktat in Claude Code und wie du in langen Sessions die Hände von der Tastatur lässt — findest du in den oben verlinkten Begleitartikeln.

Eine längere Betrachtung dazu, warum Sprache zur Arbeit mit KI passt, gibt es in warum deine Tastatur das falsche Werkzeug zum Denken mit KI ist.

Häufige Fragen

Funktioniert Loqua mit dem Chat-Panel von Cursor?

Ja. Loqua erkennt, wenn das Chat-Panel von Cursor geöffnet ist, und behandelt dein Diktat als Prompt statt als Code-Edit. Der ausgewählte Code (falls vorhanden) wird als Kontext mitgegeben. Öffne zuerst das Chat-Panel; andernfalls könnte Loqua das Diktat als Code-Datei-Edit interpretieren.

Funktioniert Loqua mit Claude Code?

Ja. Claude Code läuft im Terminal, und Loqua behandelt dessen Prompt als Kontext für strukturierte Anweisungen — die Ausgabe enthält explizite Dateipfade und bei Bedarf einen kurzen Plan. Lange Refactor-Erläuterungen und das Entwerfen von Specs sind die Bereiche, in denen das besonders gut funktioniert.

Kann ich Code Zeichen für Zeichen diktieren?

Technisch ja, aber tu es nicht. Sprache eignet sich für den Prosa-Teil des Prompts — die Erklärung, das Ziel, die Einschränkungen. Lass das LLM den Code erzeugen. Code Buchstabe für Buchstabe zu diktieren verfehlt den Zweck.

Woher weiß Loqua, ob es sich um einen Prompt oder einen Code-Edit handelt?

Loqua liest die aktive App, den Fokus-Status und sichtbare UI-Hinweise. Ein geöffnetes Chat-Panel von Cursor ist ein Prompt-Signal. Das Terminal von Claude Code ist ein Prompt-Signal. Ein Cursor im Funktionsrumpf einer Python-Datei ist ein Code-Edit-Signal.

Und ChatGPT oder Claude.ai im Browser?

Loqua funktioniert in jedem Texteingabefeld — auch in Prompt-Boxen im Browser. Die Ausgabe wird als markdown-freundlicher Prompt mit Abschnitten formatiert, wenn das Ziel eine Chat-KI ist.

Schickt Loqua meine Prompts an einen Cloud-Dienst?

Die Spracherkennung und die multimodalen Kontextschichten von Loqua laufen lokal. Der Text, der in Cursor oder Claude Code getippt wird, ist das, was diese Tools dann an ihre Anbieter (Anthropic, OpenAI usw.) schicken — das ist deren Netzwerkverhalten, nicht das von Loqua. In unserem Datenschutz-Hinweis steht, was Loqua sendet und was nicht.

Teste Loqua heute

Kostenlos starten. Mac-nativ. Gebaut von Algorithmus-Forschern, die es jeden Tag nutzen.

Download

Mehr aus dem Loqua Blog

Anleitung

Code auf dem Mac diktieren: ein vollständiger Leitfaden für Cursor, VS Code und Claude Code

Produktivität

Sprache zum Denken mit KI: warum deine Tastatur das falsche Werkzeug ist

Engineering

Reinforcement Learning für Spracheingabe: GRPO, DPO und On-Policy-Distillation in unserem Voice-Stack

Vergleich

Loqua vs. Typeless: eine Mac-native Typeless-Alternative für Kontext, Coding und Tiefe