Voce per pensare con l'AI: perché la tastiera è lo strumento sbagliato
Una nota da founder sul perché i prompt parlati spesso preservano l'idea che la tastiera finisce per eliminare.
TL;DR
Usare la voce per pensare non significa digitare più in fretta. Loqua è uno strumento di digitazione vocale nativo per Mac che ti aiuta a portare idee ancora incomplete negli strumenti AI prima che la tastiera le comprima. Quando lavori con un LLM, il collo di bottiglia spesso è preservare la sfumatura, non produrre parole digitate alla perfezione.
Un tempo pensavo che la voce fosse un'interfaccia di accessibilità o una funzione di comodità. Ho cambiato idea dopo aver usato strumenti AI ogni giorno. La tastiera è eccellente per la precisione, ma è uno strumento povero per pensare con l'AI perché costringe troppo presto l'idea dentro un canale stretto.
Il collo di bottiglia della tastiera
Chi digita velocemente può arrivare a circa 70 parole al minuto. Il parlato conversazionale è spesso più vicino a 150 parole al minuto, e il pensiero interno può muoversi più rapidamente di entrambi. I numeri esatti contano meno della forma: la tastiera ti fa serializzare il pensiero in frammenti già rifiniti prima che l'idea sia pronta.
Questo è il collo di bottiglia della tastiera. Non è che digitare sia lento in senso assoluto. È che digitare ti spinge a modificare mentre stai ancora formando il pensiero. Con l'AI, questa compressione precoce spesso elimina l'ambiguità utile: l'avvertenza, l'alternativa, la cosa di cui non sei sicuro ma che vuoi far considerare al modello.
Me ne accorgo soprattutto quando sono stanco. A fine giornata i miei prompt digitati diventano più corti e il modello diventa di conseguenza meno utile. La stessa sera, dettare lo stesso intento nello stesso strumento produce una risposta migliore, perché la versione parlata conserva ancora il contesto che avrei eliminato a mano. La tastiera non mi rallenta soltanto: dopo una certa ora mi rende un collaboratore peggiore per il modello.
L'AI cambia la forma del prompt
Lavorare con un LLM assomiglia più a fare un briefing a un collaboratore che a impartire un comando. I prompt migliori spesso includono contesto, motivo, vincoli, esempi e incertezza. I prompt vocali servono meglio gli strumenti AI quando il problema è ancora sfocato, perché puoi dire il contesto circostante senza fermarti a renderlo elegante.
Ecco perché la voce per pensare conta. Puoi dire: "Penso che il bug sia nella cache key, ma non sono sicuro che la locale dell'utente ne faccia parte; ispeziona prima quel percorso e dimmi se sbaglio." Digitato, spesso diventa "check cache bug". Il prompt più corto perde il pensiero.
La forma di un prompt ora è parte del lavoro, non un preambolo. Tratta il prompt come l'artefatto che stai producendo, e la voce diventa lo strumento di authoring naturale: preserva la struttura di come capisci davvero il problema, incluse le parti di cui non sei sicuro. Un modello che riceve la forma incompleta spesso restituisce una risposta migliore di un modello che riceve un comando sicuro ma parziale.
Tre momenti che mi hanno fatto cambiare idea
Il primo è stato durante una sessione di debugging. Ho scritto un prompt breve a un agente chiedendogli di ispezionare una regressione. È finito sulla pista sbagliata. Poi ho dettato la versione disordinata: cosa era cambiato, cosa sospettavo, cosa dubitavo e cosa avrebbe smentito la mia teoria. L'agente ha trovato il problema più in fretta perché gli avevo finalmente dato la forma della mia incertezza.
Il secondo è stato nella scrittura. Ho digitato un paragrafo nitido sul nostro stack di modelli: sembrava corretto ma morto. Ho detto la stessa idea camminando, includendo la frustrazione che ci aveva portato a quell'architettura. La versione dettata aveva l'argomento vero. L'ho comunque modificata, ma partivo da una bozza viva invece che da uno schema sterile.
Il terzo è stato una risposta lunga e scomoda a un cliente. Il cliente aveva fatto una domanda senza risposta pulita; la risposta onesta richiedeva tradeoff e una piccola scusa. Digitata, la mia risposta è passata per sei revisioni e sembrava ancora rigida. Dettata, la prima versione era più calda, più diretta e richiedeva solo la correzione di una parola. Ho inviato quella versione è la conversazione è andata avanti. Non mi fido più delle risposte digitate quando un messaggio richiede un minimo di tono.
Come uso la voce oggi
Uso la voce per il primo passaggio di pensiero, non per la precisione finale. Detto il brief disordinato in Claude Code, Cursor, Obsidian o in un semplice file Markdown. Poi passo alla tastiera per le modifiche esatte. Questa divisione tiene ogni strumento nel suo ruolo: voce per il contesto, tastiera per la chirurgia.
- Prima di programmare: detto la modifica, il rischio e il percorso di test. La versione dettata di solito fa emergere un rischio che avrei saltato digitando.
- Prima di scrivere: dico l'argomento ad alta voce prima di fare la scaletta. Se non riesco a dirlo in due minuti, non so ancora cosa penso.
- Prima delle riunioni: detto la decisione che mi serve dalla call. Entrare in riunione con una decisione nominata cambia la conversazione.
- Dopo un fallimento: detto ciò che mi ha sorpreso prima che il ricordo sbiadisca. La mattina dopo, se non l'ho catturata, la lezione è già sparita.
Per un contesto esterno sulla velocità del parlato e sui pattern di dettatura, sono utili come punto di partenza gli articoli del Nielsen Norman Group sullo speech recognition e i riferimenti sulle parole al minuto.
Le obiezioni che sento più spesso
"Lavoro in spazi condivisi." Giusto, ed è un vincolo reale. La mia risposta è che anche dieci minuti tranquilli al giorno dedicati a dettare i prompt difficili sono più utili di una giornata intera di prompt digitati. La voce non deve dominare il workflow per cambiarlo.
"Riesco a pensare mentre digito." Alcune persone ci riescono davvero. Il test non è se riesci a produrre testo digitando; è se il testo che produci digitando ha la stessa forma del pensiero che avresti detto. Per la maggior parte di noi, me incluso, la versione digitata è costantemente meno completa.
"Quando detto sembro dispersivo." La prima settimana è ruvida. La seconda va molto meglio. L'abilità che si impara non è parlare; è dare forma a un pensiero parlato in qualcosa che un lettore, o un modello, possa usare. Torna prima del previsto perché tutti l'abbiamo già usata, solo nelle conversazioni.
Dove entra Loqua
Abbiamo scritto Loqua perché volevo usare la voce per pensare senza accettare la pulizia di trascrizioni grezze. Rimuove false partenze, mantiene i nomi tecnici e formatta l'output per l'app in cui mi trovo. Il pitch morbido è questo: usa Loqua quando l'idea è troppo grande o troppo fragile per passarla prima attraverso la tastiera.
Per la versione pratica di questo argomento, vedi la nostra giornata di lavoro voice-first. Quel post mostra quando la voce funziona, quando fallisce e quando continuo a scegliere la tastiera. Il punto di questo post è il perché; quello è il come.
Domande frequenti
Prova Loqua oggi
Gratis per iniziare. Nativa per Mac. Costruita da ricercatori di algoritmi che la usano ogni giorno.
Scarica per Mac