How-to

ライターのためのハンズフリーディクテーション: 小説、エッセイ、長文を一気に 3000 語ドラフトする方法

歩く、ペーシング、皿洗い — 長文ドラフトに手は要らない。フィラークリーンアップ、人物名辞書、お気に入りのライティングアプリでのアプリ認識フォーマット、5 つの作例。

TL;DR

長文ドラフト - 小説、エッセイ、ブログ投稿、学術章 - はファーストパスに手を必要としません。Loqua のフィラーワードクリーンアップ、個人辞書、Scrivener、Ulysses、Notes、Obsidian のアプリ認識フォーマットで、話された思考を編集可能な散文に変えられます。このライター向けディクテーションワークフローは、素早く本物のドラフトが必要で、その後キーボードとトラックパッドで磨くときに最も強いです。

Loqua は Mac 向けのコンテキスト認識型音声入力ツールで、話している間にフィラーとフォルススタートを取り除き、最もよく使う固有名詞を学習し、いる書き込み表面用に出力をフォーマットします。大半のディクテーションツールが「言ったことを書き起こす」で止まるのに対し、Loqua の言語インテリジェンスレイヤーは文中の修正をクリーンな散文に書き直すので、後でクリーンアップが必要な書き起こしを作ることなく考えを声に出せます。

今年これを使ってフィクション、エッセイ、内部メモ、学術論文 1 本をドラフトしました。すべてに機能するパターンは同じです: 話す、歩く、一時停止、もっと話す、Loqua にクリーンテキストを生成させる。最後の磨きのパスはタイピング後のものより短くなります。

これは実践的なライター向けディクテーションガイドであり、すべてのセッションが出版可能な散文を生成するという約束ではありません。音声は空白ページの遅延を取り除き、シーン、エッセイ、議論を編集可能な形に素早く持っていくときに最も役立ちます。

なぜ長文に音声か

三つの理由。一つ目、あなたはタイプより速く話します、散文では成長するマージンで。二つ目、ドラフト段階で机に縛られないことから身体が恩恵を受けます — 多くのライターが、歩くことが散文自体を改善すると報告しています。三つ目、音声ドラフトの後の編集パスは、セッションあたりより多くの文を生成したので、軽くなる傾向があります。つまり拡張する文がより少ないのではなく、削るための素材がより多い、ということです。

大半のディクテーションツールの罠は、話して節約した時間をクリーンアップで使うことです — 「um」「so」「you know」と文中の「actually wait let me start over」を取り除く。Loqua の言語インテリジェンスレイヤーは進行中にそれらを取り除きます。ドラフトに届くものは、口から出てくるものよりクリーンです。

クリーンアップモデル

クリーンアップは積極的な編集判断ではありません。Loqua はあなたの声を再形成したりスタイルを押し付けたりしません。(ここでの保守的なバイアスは意図的です — クリーンアップレイヤーが乗る on-device 基盤については Apple の音声入力パイプラインを参照してください。) 任意の人間編集者が静かに削除する三つを取り除きます:

  • フィラーワード: um、uh、you know、like (フィラーとして)、I mean、so。
  • 自己修正: 「so basically the thing is — actually wait, let me start over — we should cache this」と言うと、「We should cache this」が得られます。文中の修正は尊重され、咳払いは消えます。
  • 再開: 本物の文が始まる前のフォルススタート。

残されるもの: あなたの声、文の形、慣用表現、段落区切りとしてのペース。スタイルに意図的なためらいや em ダッシュが含まれていれば、生き残ります — クリーンアップはターゲットされたものです。

あなたが話す
「um so basically the thing is we need to uh... actually wait let me start over — we should cache this for like fifteen minutes」
Loqua の書き込み
これを 15 分間キャッシュすべきです。

キャラクターと用語辞書

長文フィクションディクテーションでの最大の痛みはキャラクター名です。主人公の名前が「Beatrix Ó hUiginn」かもしれません — 助けなしにそれを扱う書き起こしモデルは地球上に存在しません。Loqua には設定に Personal Dictionary があり、固有名詞を 1 行 1 つ追加します。一度追加すると、名前は毎回正確に綴られます、正しいダイアクリティクス付きで。

設定名、発明された技術、魔法システム用語、哲学的専門用語、作品で繰り返される珍しい単語も同じです。辞書はドキュメントごとにできます — 異なる宇宙で複数の小説を書くなら有用です。

ヒント: プロジェクトの開始時に辞書を読み込んでください。最初の 1 時間でギャップを発見します。追加すれば、ドラフトの残りは摩擦フリーです。

アプリ固有のフォーマット

Loqua はあなたがディクテーションしているアプリを読んで、それに応じて出力を調整します。これはコードフォーマットを扱うのと同じマルチモーダルコンテキストエンジン (Mac でコードをディクテーションするガイド参照) を、ライティングアプリに向けたものです:

アプリLoqua の差異化された動作
Scrivener1 文 1 行のドラフト形式、セクション区切りを尊重、バインダーのチャプターコンテキストを尊重
UlyssesMarkdown クリーン出力、Ulysses のファーストクラス markdown 構文を使用
Notes (Apple)標準段落形式、アクティブならブレットリストモードを尊重
Obsidianfrontmatter 認識付き Markdown、YAML frontmatter ブロックが開いていればディクテーションは正しくそこに入る
Pages / Wordクリーンな散文段落、markdown リーク無し
iA WriterMarkdown、アプリのフォーカスモード慣例を尊重

これをアプリごとに設定する必要はありません。Loqua はアクティブアプリを検出して調整します。ドラフト途中でツールを切り替えて出力が意味を成し続けるときだけ気づく、そういう機能の一つです。

5 つの作例

あなたが話す (小説のアウトライン、歩きながらディクテーション)
「オーケー、チャプター 3 — Beatrix が手紙を受け取って、すぐに開けるか 1 日寝かせるかを決めなければならない、彼女は寝かせると思う、その方が彼女らしい」
Loqua の書き込み (Scrivener)
チャプター 3 — Beatrix が手紙を受け取る。

決定ポイント: 即座に開けるか 1 日寝かせるか。寝かせる — より彼女らしい。遅延がシーン 2 での Elena の介入のためのスペースを作る。
あなたが話す (フィクションのシーン描写)
「朝 6 時のキッチン、30 年間窓からの光が同じであり続けたような種類のキッチン、コンロのケトルがどういうわけかいつもほとんど沸騰している」
Loqua の書き込み (Ulysses)
朝 6 時のキッチン — 30 年間窓からの光が同じであり続けたような種類のキッチンで、コンロのケトルはどういうわけかいつもほとんど沸騰している。
あなたが話す (会議の合間に学術アブストラクト)
「この論文は音声入力システムにおけるマルチモーダルコンテキスト統合を測定するためのフレームワークを提示する、三つのベンチマークを提案し、四つの本番ツールに適用、オンデバイスマルチモーダルモデルがアプリ認識フォーマットタスクで意味のあるエラー削減をすることを示す」
Loqua の書き込み (Pages)
本論文は、音声入力システムにおけるマルチモーダルコンテキスト統合を測定するためのフレームワークを提示する。三つのベンチマークを提案し、四つの本番ツールに適用、オンデバイスマルチモーダルモデルがアプリ認識フォーマットタスクで意味のあるエラー削減をもたらすことを示す。
あなたが話す (犬の散歩中のブログドラフト)
「ライターのための音声入力について、クリーンアップモデルは音声認識モデルよりも重要、認識が十分に良くなれば、違いの大半は何が取り除かれるかと文がどう着地するかにある」
Loqua の書き込み (Obsidian)
ライターのための音声入力について重要なのは、クリーンアップモデルが音声認識モデルよりも重要だということです。認識が十分に良くなれば、違いの大半は何が取り除かれるか — そして文がどう着地するか、にあります。
あなたが話す (ドラフトへの編集注釈)
「このセクションは大丈夫だけど 300 ワード長すぎる、ケトルの比喩はチャプター 4 に移すべき、そこで実際に効いてくる」
Loqua の書き込み (Scrivener コメント)
セクションは大丈夫だが ~300 ワード長すぎる。ケトルの比喩はチャプター 4 に移すべき、そこで効いてくる。

音声による編集

編集を直接ディクテーションできます: 「最後の段落を…で置き換えて」「ケトルという単語の後にカンマを追加」「二つ目の文を削除」。Loqua は現在の選択 (あれば) とあなたの言い回しを読んで、挿入、置換、注釈のどれをするかを決めます。重い編集の場合、私たちが知る大半のライターはキーボードに戻ります — しかし多くの調整には音声の方が速いです。

正直なバージョン: 音声編集は追加と削除には良く、置換にはまあまあ、複雑な再構造化には遅いです。再構造化はトラックパッドに手を伸ばす時です。

多言語長文

私たちが話した多くのライターが、長文に別の言語からの引用や用語を埋め込みます。Loqua はこれをモード切り替えなしで扱います:

あなたが話す (エッセイドラフト)
「英語で最も近い等価語はおおむね contentment だが、中国語の用語 安然 はうまくマップしない諦めの含意を持っている」
Loqua の書き込み (iA Writer)
英語で最も近い等価語はおおむね「contentment」だが、中国語の用語 安然 はうまくマップしない諦めの含意を持っている。

これはコードでのコードスイッチングを動かすのと同じアーキテクチャです (AI コーディングのための音声入力参照) — Loqua の言語インテリジェンスレイヤーはコードスイッチされたデータを回避するのではなく、それで訓練されています。

私たちが実際に使うワークフロー

これは何ヶ月もの長文音声ドラフトの末に私たちが収束したワークフローです:

  • ライティングアプリを最初に開く。 カーソルを適切な場所に。Loqua はカーソル位置を読んでフォーマットを決定します。
  • セッション開始時に Personal Dictionary に固有名詞をロード。 ここでの 5 分が後で 1 時間を節約します。
  • 段落で話す、文ではなく。 段落区切りで一時停止、すべての文の後ではなく。Loqua は一時停止を尊重します。
  • さまよわせてください。 クリーンアップモデルはさまよいを取り除きます。届くのはあなたが手を伸ばしていた行です。
  • 可能なら歩いてください。 音声タイプする小説家の大半が、動いているとき散文が変わると言います — 通常はより良く。
  • 進行中ではなく最後に素早く磨く。 音声ドラフトはタイプしたものと違って読まれます。一度声に出して読んでください。通常はすでに流れています。

音声が最も変えるものは思考と書く関係です。先に考え、後に書く — そして書かれるものはあなたが考えたものであり、キーボードでついていけたものではありません。思考がボトルネックの長文業務にとって、それが全ゲームです。これが重要な理由についての一つの外部視点として、より広い ドラフト速度に関する研究を参照してください。

クリーンアップとコンテキストレイヤーがどう機能するかの技術詳細が欲しければ、三モデルアーキテクチャノートがより深く掘り下げます。

Frequently asked questions

Loqua はライターとしての私の声を台無しにしますか?
いいえ。Loqua はフィラーワードとフォルススタートのみを取り除きます。文の形、慣用表現、em ダッシュ、意図的な反復、ペースはすべて生き残ります。スタイルに「...」の一時停止や断片が含まれていれば、生き残ります。クリーンアップモデルは意図的に保守的に調整しました。ライターはより重いものに否定的に反応したからです。
固有名詞辞書はどれくらいうまく機能しますか?
設定 → Personal Dictionary に用語を一度追加すると、ダイアクリティクスとハイフネーション含めて以降正しく綴られます。長期プロジェクト (50+ 名のキャラクターの小説シリーズ) には、セッション開始時に辞書を構築してください — 前払いの 5 分がドラフト全体で 1 時間を節約します。
Loqua は Scrivener を特にサポートしますか?
はい。Loqua は Scrivener のバインダー状態を読み、セクション区切りを尊重した 1 文 1 行のドラフト形式で出力します。同じディクテーションがカーソル位置で現在の Scrivener ドキュメントにきれいに落ちます。
歩きながらディクテーションできますか?
はい、AirPods Pro または類似マイクで。Apple Silicon 上の音声入力パイプラインは、歩行の可変的な音響条件 (足音、マイクからの距離、時々の風) を合理的にうまく扱います。単語エラー率は静かなデスクと比較してわずかに上がります。通常はまだ 5% 未満です。
フィクションの方言やアクセントはどうですか?
キャラクターが方言で話すなら、Loqua は方言を書き起こします (標準英語に「修正」しません)、あなたがそれを発音する限り。対話での書かれた方言には、正しい声のレジスタでディクテーションすれば通常望むテキストが生成されます。
音声でドラフトを編集できますか?
軽い編集なら、はい — 置換、追加、削除。「最後の段落で『kettle』を『pot』に置き換えて」は機能します。重い再構造化 (シーンの移動、章のアークの再構築) はマウスとキーボードの方が速いです。音声はドラフトと軽い改訂に最適、キーボードは構造編集に最適です。

Try Loqua today

Free to start. Mac native. Built by algorithm researchers who use it every day.

Download for Mac

More from the Loqua Blog

productivity
音声プロダクティビティスタック: 私たちが実際に使っている 9 つのツール
how-to
Mac の会議メモを音声で: ノートとアクションアイテムを音声から完了まで
productivity
ボイスファーストのワークフロー: 私たちのボイスファースト勤務日
compare
Loqua vs Typeless: コンテキスト、コーディング、深さのための Mac ネイティブの Typeless 代替
engineering
オムニモーダル音声入力: マルチモーダル理解、MoE、ストリーミングテキスト出力