How-to

작가를 위한 핸즈프리 받아쓰기: 소설, 에세이, 장문 초안 3000자를 한 번에 쓰는 법

걷거나, 서성거리거나, 설거지하면서 — 장문 초안에 손은 필요 없어요. 필러 정리, 캐릭터 이름 사전, 좋아하는 글쓰기 앱에 맞춘 포맷팅, 그리고 다섯 가지 실제 예시.

요약

장문 초안 — 소설, 에세이, 블로그 글, 학술 챕터 — 첫 번째 패스에는 손이 필요 없어요. Loqua의 필러 정리, Personal Dictionary, 그리고 Scrivener·Ulysses·Notes·Obsidian용 앱별 포맷팅을 쓰면 떠오른 생각을 편집 가능한 산문으로 바꿀 수 있어요. 이 작가용 받아쓰기 워크플로는 제대로 된 초안을 빨리 뽑은 다음 키보드와 트랙패드로 다듬을 때 가장 강력해요.

Loqua는 맥용 컨텍스트 인식 음성 입력 도구예요. 말하는 동안 필러와 false-start를 걷어내고, 자주 쓰는 고유명사를 학습하고, 작업 중인 글쓰기 화면에 맞게 출력 포맷을 잡아줘요. 대부분의 받아쓰기 도구가 "말한 그대로 받아쓰기"에서 멈추는 반면, Loqua의 언어 인텔리전스 레이어는 문장 도중의 자기 수정을 깔끔한 산문으로 다시 써줘서, 나중에 정리해야 할 transcript를 만들지 않고 그냥 소리 내어 생각할 수 있어요.

저희도 올해 소설, 에세이, 사내 메모, 그리고 학술 논문 하나를 이걸로 초안 잡았어요. 다 똑같은 패턴이 통했어요: 말하고, 걷고, 멈추고, 더 말하면 Loqua가 깔끔한 텍스트를 뽑아줘요. 마지막에 다듬는 패스도 타이핑한 글을 다듬는 것보다 짧아요.

이건 작가를 위한 실용적인 받아쓰기 가이드지, 모든 세션이 출판 가능한 산문을 뽑아낸다는 약속은 아니에요. 음성은 백지 공포를 없애고 장면이나 에세이, 논증을 빠르게 편집 가능한 형태로 만들 때 가장 도움이 돼요.

왜 장문에 음성인가

세 가지 이유가 있어요. 첫째, 타이핑보다 말하는 게 빠르고, 산문이 길어질수록 그 차이가 커져요. 둘째, 초안 단계에 책상에 묶여 있지 않으면 몸이 편해요 — 걸으면 산문 자체가 좋아진다는 작가가 많아요. 셋째, 음성 초안 뒤에 따라오는 편집 패스가 보통 더 가벼워요. 한 세션당 더 많은 문장이 나오니까, 늘리기보다는 줄일 재료가 더 많아지는 거예요.

대부분의 받아쓰기 도구의 함정은, 말로 절약한 시간을 정리에 다 쓰게 된다는 거예요 — "음," "그래서," "있잖아," 그리고 문장 중간의 "잠깐, 다시 시작할게"를 지우는 데에요. Loqua의 언어 인텔리전스 레이어는 그걸 진행 중에 제거해요. 초안에 들어가는 건 입에서 나오는 것보다 더 깔끔해요.

정리 모델

정리는 공격적인 편집이 아니에요. Loqua는 작가님의 목소리를 다시 빚지도, 어떤 스타일을 강요하지도 않아요. (보수적으로 잡은 건 의도예요 — 정리 레이어가 그 위에 올라타는 온디바이스 기반은 Apple의 음성 입력 파이프라인을 참고하세요.) 어떤 인간 편집자라도 조용히 지웠을 세 가지만 제거해요:

  • 필러 단어: 음, 어, 있잖아, like(필러로 쓰일 때), I mean, 그러니까.
  • 자기 수정: "그러니까 기본적으로 핵심은 — 잠깐 다시 시작할게 — 이걸 캐싱해야 해" 라고 말하면, "We should cache this." 가 나와요. 문장 중간의 수정은 살리고, 군더더기만 사라져요.
  • 재시작: 진짜 문장이 시작되기 전의 false start.

유지하는 것들: 작가님의 목소리, 문장 구조, 관용 표현, 문단 나눔의 호흡. 의도적인 망설임이나 em dash가 스타일이라면 살아남아요 — 정리는 타깃이 명확해요.

이렇게 말하면
"um so basically the thing is we need to uh... actually wait let me start over — we should cache this for like fifteen minutes"
Loqua가 이렇게 적어요
We should cache this for fifteen minutes.

캐릭터·용어 사전

장편 픽션 받아쓰기에서 가장 골치 아픈 건 캐릭터 이름이에요. 주인공 이름이 "Beatrix Ó hUiginn"이라면 — 도움 없이 그걸 받아쓰는 모델은 세상에 없어요. Loqua는 Settings에 Personal Dictionary가 있어서 고유명사를 한 줄에 하나씩 추가할 수 있어요. 한 번 추가하면 매번 정확한 발음 부호와 함께 똑같이 표기돼요.

설정 이름, 가상의 기술, 마법 시스템 용어, 철학적 전문 용어, 작품에 반복해서 나오는 흔치 않은 단어도 마찬가지예요. 원한다면 문서별로 사전을 둘 수도 있어요 — 서로 다른 세계관의 소설을 여러 편 쓴다면 유용해요.

팁: 프로젝트 시작 시점에 사전을 로드해두세요. 첫 한 시간에 빈틈이 보일 거예요. 채워두면 나머지 초안은 마찰 없이 흘러가요.

앱별 포맷팅

Loqua는 받아쓰기를 하고 있는 앱이 뭔지 읽고 그에 맞게 출력을 조정해요. 코드 포맷팅을 처리하는 멀티모달 컨텍스트 엔진과 같은 거예요(Mac에서 코드 받아쓰기 가이드 참조). 글쓰기 앱에 맞춰진 거예요:

Loqua가 다르게 하는 것
Scrivener한 줄 한 문장 초안 형식; 섹션 구분 유지; binder의 챕터 컨텍스트를 존중
Ulysses마크다운에 맞는 출력; Ulysses의 일급 마크다운 문법을 활용
Notes (Apple)표준 단락 형식; 불릿 리스트 모드가 활성화돼 있으면 그걸 존중
Obsidianfrontmatter를 인식하는 마크다운; YAML frontmatter 블록이 열려 있으면 받아쓰기가 그 안에 정확히 들어감
Pages / Word깔끔한 산문 단락, 마크다운 누출 없음
iA Writer마크다운; 앱의 포커스 모드 관습을 존중

앱마다 따로 설정할 필요 없어요. Loqua가 활성 앱을 감지해서 알아서 조정해요. 초안 작업 중에 도구를 바꿔도 출력이 계속 말이 되는 걸 보고서야 깨닫게 되는 기능이에요.

실제 예시 다섯 가지

이렇게 말하면 (소설 아웃라인, 서성거리면서 받아쓰기)
"okay chapter three — Beatrix gets the letter and we have to decide whether she opens it right away or sits with it for a day I think she sits with it that's more her"
Loqua가 이렇게 적어요 (Scrivener에서)
Chapter 3 — Beatrix receives the letter.

Decision point: opens immediately vs sits with it for a day. Sits with it — more in character. The delay creates space for Elena's interjection in scene two.
이렇게 말하면 (픽션 장면 묘사)
"the kitchen at six in the morning the kind of kitchen where the light through the window has been the same for thirty years and the kettle on the stove is somehow always almost boiling"
Loqua가 이렇게 적어요 (Ulysses에서)
The kitchen at six in the morning — the kind of kitchen where the light through the window has been the same for thirty years, and the kettle on the stove is somehow always almost boiling.
이렇게 말하면 (회의 사이 짬에 학술 초록)
"this paper presents a framework for measuring multimodal context integration in voice typing systems we propose three benchmarks and apply them to four production tools showing that on-device multimodal models meaningfully reduce error on app-aware formatting tasks"
Loqua가 이렇게 적어요 (Pages에서)
This paper presents a framework for measuring multimodal context integration in voice typing systems. We propose three benchmarks and apply them to four production tools, showing that on-device multimodal models meaningfully reduce error on app-aware formatting tasks.
이렇게 말하면 (강아지 산책하면서 블로그 초안)
"the thing about voice typing for writers is that the cleanup model matters more than the speech recognition model — once recognition is good enough most of the difference is in what gets removed and how the sentences land"
Loqua가 이렇게 적어요 (Obsidian에서)
The thing about voice typing for writers is that the cleanup model matters more than the speech recognition model. Once recognition is good enough, most of the difference is in what gets removed — and how the sentences land.
이렇게 말하면 (초안에 다는 편집 코멘트)
"this section is fine but it's three hundred words too long the metaphor about the kettle should move into chapter four where it actually pays off"
Loqua가 이렇게 적어요 (Scrivener 코멘트로)
Section is fine but ~300 words too long. The kettle metaphor should move into Chapter 4 where it pays off.

음성으로 편집하기

편집을 직접 받아쓸 수도 있어요: "마지막 단락을 ...로 교체해줘", "kettle 다음에 쉼표 추가해줘", "두 번째 문장 지워줘". Loqua는 현재 선택 영역(있다면)과 작가님의 표현을 읽어서 삽입할지, 교체할지, 주석을 달지 결정해요. 더 무거운 편집은 저희가 아는 작가 대부분이 키보드로 돌아가지만, 많은 조정 작업에서는 음성이 더 빨라요.

솔직히 말하면: 음성 편집은 추가와 삭제에 좋고, 대체에는 괜찮고, 복잡한 구조 변경에는 느려요. 구조를 바꿀 때는 트랙패드를 잡으세요.

다국어 장문

저희가 얘기해본 작가 중 다수가 장문에 다른 언어의 인용이나 용어를 끼워 넣어요. Loqua는 모드 전환 없이 처리해요:

이렇게 말하면 (에세이 초안)
"the closest English equivalent is roughly contentment but the Chinese term 安然 carries connotations of resignation that don't quite map"
Loqua가 이렇게 적어요 (iA Writer에서)
The closest English equivalent is roughly "contentment," but the Chinese term 安然 carries connotations of resignation that don't quite map.

코드에서 code-switching을 가능하게 하는 것과 같은 아키텍처예요(AI 코딩을 위한 음성 입력 참고) — Loqua의 언어 인텔리전스 레이어는 code-switching된 데이터를 우회하지 않고 그 데이터로 학습돼요.

실제로 쓰고 있는 워크플로

몇 달간 장문을 음성으로 받아쓰면서 저희가 수렴한 워크플로예요:

  • 글쓰기 앱부터 여세요. 커서를 원하는 위치에. Loqua가 커서 위치를 읽어서 포맷을 결정해요.
  • 세션 시작 시점에 고유명사를 Personal Dictionary에 채워두세요. 여기 5분이 나중에 한 시간을 아껴줘요.
  • 문장이 아니라 단락 단위로 말하세요. 매 문장이 아니라 단락 사이에 멈추세요. Loqua가 그 멈춤을 살려줘요.
  • 마음껏 헤매세요. 정리 모델이 헤맴을 걷어내요. 도착하는 건 작가님이 닿으려 했던 그 문장이에요.
  • 가능하면 걸으세요. 음성으로 글 쓰는 소설가 대부분이 움직일 때 산문이 바뀐다고 말해요 — 보통은 좋은 쪽으로요.
  • 다듬기는 마지막에 빠르게, 진행 중엔 말고. 음성 초안은 타이핑한 글과 결이 달라요. 한 번 소리 내어 읽으면 보통 이미 흘러가요.

음성이 가장 크게 바꾸는 건 생각과 글쓰기의 관계예요. 먼저 생각하고, 그다음에 쓰는 거예요 — 그리고 쓰는 건 작가님이 생각한 것이지, 키보드로 따라잡을 수 있었던 것이 아니에요. 병목이 생각인 장문 작업에서는 그게 전부예요. 이게 왜 중요한지 외부 시각이 궁금하면 빠른 초안 작성에 관한 연구를 참고하세요.

정리 레이어와 컨텍스트 레이어가 어떻게 작동하는지 기술적인 디테일이 궁금하다면 3모델 아키텍처 노트가 더 깊이 들어가요.

자주 묻는 질문

Loqua가 작가로서의 제 목소리를 망치지는 않을까요?
아니요. Loqua는 필러 단어와 false-start만 제거해요. 문장 구조, 관용 표현, em dash, 의도적 반복, 호흡은 그대로 유지돼요. 만약 "..." 같은 멈춤이나 단편적 문장이 작가님 스타일이라면 그것도 살아남아요. 작가분들이 강한 편집에 민감하게 반응하셔서, 정리 모델을 일부러 보수적으로 튜닝했어요.
고유명사 사전은 얼마나 잘 작동하나요?
Settings → Personal Dictionary에 한 번만 등록하면 그 뒤로는 발음 부호와 하이픈까지 정확히 표기돼요. 캐릭터 이름이 50개 넘는 장편 시리즈처럼 길게 가는 프로젝트라면 세션 시작 전에 사전을 채워두세요 — 처음에 5분 투자하면 초안 작업 중 한 시간이 절약돼요.
Loqua가 Scrivener를 따로 지원하나요?
네. Loqua는 Scrivener의 binder 상태를 읽어서 섹션 구분을 살리는 한 줄 한 문장 초안 형식으로 출력해요. 같은 받아쓰기가 현재 Scrivener 문서의 커서 위치로 깔끔하게 들어가요.
걸으면서 받아쓰기 할 수 있나요?
네, AirPods Pro나 비슷한 마이크가 있으면 가능해요. Apple Silicon의 음성 입력 파이프라인이 걸을 때의 가변적인 음향 조건(발소리, 마이크와의 거리, 가끔 부는 바람)을 꽤 잘 처리해요. 조용한 책상에 비해 단어 오류율이 살짝 올라가지만 보통 5% 미만이에요.
소설 속 사투리나 억양은요?
캐릭터가 사투리로 말한다면 Loqua는 그 사투리를 그대로 옮겨 적어요(표준어로 "교정"하지 않아요). 발음만 정확하면 돼요. 대화 속에 적힌 사투리의 경우, 그에 맞는 음역대로 받아쓰면 보통 원하는 텍스트가 나와요.
초안을 음성으로 편집할 수 있나요?
가벼운 편집은 가능해요 — 대체, 추가, 삭제. "마지막 단락의 'kettle'을 'pot'으로 바꿔줘" 같은 명령이 잘 동작해요. 무거운 구조 변경(장면 이동, 챕터 흐름 재작업)은 마우스와 키보드가 더 빨라요. 음성은 초안 쓰기와 가벼운 수정에 가장 좋고, 구조적 편집은 키보드가 가장 좋아요.

오늘 Loqua를 써보세요

무료로 시작. 맥 네이티브. 매일 직접 쓰는 알고리즘 연구자들이 만들었어요.

맥용 다운로드

Loqua 블로그 더 보기

productivity
보이스 생산성 스택: 글 쓰고, 배포하고, 생각하는 데 실제로 쓰는 9가지 도구
how-to
맥 회의 노트 음성: 음성에서 노트와 액션 아이템까지
productivity
보이스 퍼스트 워크플로: 우리의 보이스 퍼스트 하루
compare
Loqua vs Typeless: 컨텍스트, 코딩, 깊이를 위한 맥 네이티브 Typeless 대안
engineering
옴니모달 음성 입력: 멀티모달 이해, MoE, 스트리밍 텍스트 출력