Spracheingabe für AI Coding: Cursor und Claude Code per Sprach-Prompt ohne Tippen
Vibe Coding geht schneller, wenn du die Änderung beschreiben kannst, statt sie zu tippen. Sechs ausgearbeitete Beispiele, die Prompt-Muster, auf die wir uns eingependelt haben, und wie du mit mehrsprachigen Bezeichnern umgehst.
TL;DR
Wenn du suchst, wie man Cursor per Sprach-Prompt bedient — oder wie man Claude Code Diktat richtig hinbekommt, ohne jeden Bezeichner zu buchstabieren — ist das hier der praktische Leitfaden. Spracheingabe für AI Coding funktioniert, weil Prompts überwiegend Prosa sind: Kontext, Absicht, Einschränkungen und Test-Erwartungen. Loqua ergänzt das um multimodalen Bildschirmkontext, strukturierte Prompt-Formatierung, Umgang mit technischem Vokabular und das Mischen von EN+Chinesisch mitten im Satz. Der Vibe-Coding-Workflow per Sprache, der sich am meisten auszahlt: lange Cursor-Prompts, Debugging in Claude Code, Refactor-Specs und Testbeschreibungen. Kurze „Fix das"-Prompts sind per Sprache oft nicht schneller; der Gewinn liegt in dichten Anweisungen.
Loqua ist eine kontextbewusste Spracheingabe für Mac, die sieht, woran du arbeitest, und die Ausgabe entsprechend formt. Für AI Coding heißt das konkret: Loqua erkennt das Chat-Panel von Cursor, das Terminal von Claude Code, die Prompt-Box von ChatGPT und erzeugt Prompts in der Struktur, die diese Tools am besten verarbeiten.
Das ist kein Produktivitäts-Listicle. Wir nutzen Sprache täglich für unser eigenes AI Coding und halbieren bei langen Anweisungen die Zeit fürs Prompt-Schreiben in etwa — dort ist der Gewinn am größten. Kurze Prompts („Fix das") sind ein Wash. Lange, strukturierte Prompts (Refactor-Specs, Änderungen über mehrere Dateien, Debug-Erzählungen) sind das Feld, in dem sich Sprache auszahlt.
Warum Sprache zu AI Coding passt
Die Form eines AI-Coding-Prompts unterscheidet sich von der Form von Code. Ein guter Prompt hat: einen Kontextblock (wo ich bin, was ich sehe, was ich gerade probiert habe), einen Anweisungsblock (was ich erledigt haben will) und Einschränkungen (X nicht ändern, Y bewahren, Z-Tests müssen bestehen). Das ist Prosa, keine Syntax — und Prosa ist genau das, worin Sprache stark ist.
Du denkst schneller, als du tippst — bei Prosa locker doppelt so schnell. Der Engpass ist nicht dein mentales Modell, sondern die Tastenanschlag-Steuer. Für Prompts, die einem LLM eine komplexe Situation erklären, ist diese Lücke entscheidend. Loqua legt drei Dinge auf das einfache Diktat obendrauf: Es sieht den Zustand deiner IDE (sodass sich Kontextblöcke von selbst schreiben), es formatiert Prompts strukturell (System + User oder als Aufzählung mit Schritten) und es geht mit technischem Vokabular um, ohne dass du Bezeichner buchstabieren musst.
Setup für AI Coding
Dieser Abschnitt setzt voraus, dass Loqua installiert ist (siehe unseren Setup-Guide zum Diktieren von Code auf dem Mac). Die einzige AI-Coding-spezifische Konfiguration ist, Loqua die Accessibility-Berechtigung zu erteilen, damit es die Selektion und den umliegenden Text der aktiven App lesen kann. Die macOS-Accessibility ist auf developer.apple.com dokumentiert; es ist dieselbe API, die Screenreader und Automatisierungs-Tools nutzen.
Drei Gewohnheiten zum Aufbauen:
- Vor dem Diktieren auswählen. Wenn der Prompt auf einen bestimmten Block wirken soll, wähle ihn vorher aus. Loqua reicht die Selektion als Kontext weiter.
- Das Chat-Panel inline öffnen. In Cursor signalisiert das sichtbare Chat-Panel Loqua, dass du promptest, nicht editierst.
- Pausen für strukturelle Brüche. Eine halbe Sekunde Pause wird als Absatzumbruch im Prompt gelesen — nützlich, um Kontext von Anweisung zu trennen.
Prompt-Strukturen, die funktionieren
Nach Monaten des Sprach-Promptens haben wir uns auf drei Strukturen eingependelt, die das sauberste LLM-Verhalten erzeugen. Loqua liest, wie du den Beginn einer Äußerung rahmst, und formt die Ausgabe entsprechend.
| Einleitung, die du zuerst sagst | Form der Ausgabe |
|---|---|
| „Refaktoriere das so…" | Refactor: [Ziel]. Einschränkungen: [implizit aus der Selektion]. Output: [Code]. |
| „Debugge das — wenn ich X mache, passiert Y, ich habe aber Z erwartet" | Erzählerischer Bug-Report mit Schritten, Erwartetem und Tatsächlichem. |
| „Schreib eine Spec für…" | Strukturierte Spec: Ziel / Inputs / Outputs / Randfälle / Tests. |
| „Füge einen Test hinzu, der…" | Testbeschreibung + Akzeptanzkriterien. |
| „Erkläre, warum dieser Code…" | Reine Prosa, technisches Register. |
Sechs ausgearbeitete Beispiele
AuthClient genutzt wird. Entferne den Legacy-Fallback-Pfad — bestätigt nicht woanders im Codebase verwendet. Bewahre die öffentliche Funktionssignatur.Schritte:
1. POST /search mit Body
{ "query": "" }2. Server antwortet mit 500 (erwartet: 200 mit leerem Array)
Hypothese: Der Pfad für leere Strings überspringt das Early-Return und trifft den Indexer mit einem ungültigen Query.
Fix: Early Return für leere Queries hinzufügen.
**Ziel:** Nutzer speichern eine Suchanfrage und laden sie später erneut.
**Inputs:** Suchanfrage (String), User-ID, optionaler Name (String, Default: erste N Zeichen der Anfrage).
**Verhalten:**
- In die Saved-Searches-Collection des Nutzers persistieren.
- Geräteübergreifend über bestehende User-Data-Sync synchronisieren.
- Per Name abfragbar (Substring-Match, Groß-/Kleinschreibung egal).
**Randfälle:** doppelte Namen → Suffix mit Index; gelöschter Nutzer → Cascade Delete.
- 10 Anfragen innerhalb eines 60-Sekunden-Fensters senden — alle erfolgreich.
- Die 11. Anfrage muss 429 zurückgeben.
- Die Antwort muss einen
Retry-After-Header mit dem Wert „verbleibende Sekunden" enthalten.- Bestehende Test-Fixtures zur Zeitsteuerung verwenden.
userController.ts in drei Module aufspalten — authController, profileController, preferencesController. Die öffentliche API-Oberfläche unverändert lassen. Den Router so anpassen, dass er aus den neuen Pfaden importiert. Keine Verhaltensänderungen; das ist ein rein struktureller Refactor.merge-Funktion abdeckt. Der Test soll die bestehenden Outputs als Snapshot festhalten, damit wir jede Drift erkennen können, die der Refactor einführt.Loqua den Dateikontext sehen lassen
Wenn du „refaktoriere das" ohne Selektion sagst, sendet Loqua nur die Anweisung. Sobald Text ausgewählt ist, fügt Loqua vor der Anweisung einen kurzen Kontextblock ein, der das Ausgewählte beschreibt — Dateiname, Zeilen, umliegende Bezeichner. Du musst den Kontext nicht diktieren; die multimodale Schicht liest ihn aus.
Das ist wichtig für KI-Tools, die von explizitem Kontext profitieren (Claude Code profitiert besonders von Dateipfaden und Zeilennummern). Loqua's Omni-Modal-Stack macht das möglich — wenn du die Intuition auf Forschungsebene willst, siehe den ausführlicheren Beitrag Voice trifft Vision: omni-modale Spracheingabe.
EN+中 mitten im Satz
Viele Diskussionen in unserem Engineering-Team finden auf Mandarin statt, mit eingestreuten englischen Fachbegriffen. KI-Tools in diesem Register per Sprache zu prompten ist Alltagsbeschäftigung. Loqua handhabt das Code-Switching ohne Modus-Umschaltung:
Tool-übergreifende Nutzung
Dieselbe gesprochene Phrase, in unterschiedliche KI-Tools diktiert, ergibt passend unterschiedliche Prompts. Wir formulieren nicht um — Loqua tut es:
| Tool | Prompt-Form, die Loqua erzeugt |
|---|---|
| Cursor (Chat-Panel) | Konversationale Anweisung mit implizitem Dateikontext |
| Claude Code (Terminal) | Strukturierte Anweisung mit expliziten Dateipfaden und kurzem Plan |
| ChatGPT (Web) | Markdown-formatierter Prompt mit Abschnitten |
| Aider (Terminal) | Direkte Datei-Edit-Anweisung mit Zielpfaden |
Du schreibst einmal mit deiner Stimme; Loqua formt es je Ziel um.
Stolperfallen
- Diktiere Code nicht Buchstabe für Buchstabe. Sprache ist für den Prosa-Teil des Prompts; das LLM soll den Code erzeugen. Code Zeichen für Zeichen zu diktieren verfehlt den Sinn.
- Selektion zählt. Wenn Loqua ausgewählten Code als Kontext mitnehmen soll, wähle ihn vor dem Diktieren aus. Sonst geht nur die Anweisung raus.
- Lange Pausen beenden das Diktat. 1,5 Sekunden Stille werden als Ende der Äußerung gelesen. Wenn du mitten im Satz nachdenkst, nutze ein Füllwort — Loqua entfernt Füllwörter aus der Ausgabe, lässt aber die Aufnahme offen.
- Der Zustand des Chat-Panels von Cursor zählt. Ist das Panel nicht sichtbar, behandelt Loqua dein Diktat eventuell als Code-Edit statt als Prompt. Öffne das Panel zuerst.
- Diktiere Bezeichner nicht blind. Wenn du einen eigenen, nicht gebräuchlichen Bibliotheksnamen hast, trage ihn in den Einstellungen ins persönliche Wörterbuch ein oder sprich ihn als ein Wort aus.
Aggregierter Effekt: Bei langen Anweisungen halbiert sich die Zeit fürs Prompt-Schreiben ungefähr, und die Prompts selbst werden besser, weil die Sprachform dazu zwingt, Absicht zu erklären, statt nur die Änderung zu benennen. Das ist der Teil, der mehr zählt als reine Geschwindigkeit. Mehr zum übergeordneten Voice-AI-Coding-Muster — Sprach-Prompt-Flows in Cursor, Diktat in Claude Code und wie du in langen Sessions die Hände von der Tastatur lässt — findest du in den oben verlinkten Begleitartikeln.
Eine längere Betrachtung dazu, warum Sprache zur Arbeit mit KI passt, gibt es in warum deine Tastatur das falsche Werkzeug zum Denken mit KI ist.
Häufig gestellte Fragen
Loqua heute ausprobieren
Kostenlos starten. Mac-nativ. Entwickelt von Algorithmenforschern, die es täglich nutzen.
Für Mac laden