ブログに戻る
·プロダクト

開発者のための音声入力: ボイスコーディング、AI プロンプト、ターミナル入力


開発者は、コードではない文章を書く時間が意外と長いものです。Pull Request の説明。コードレビューコメント。アーキテクチャ判断を説明する Slack メッセージ。ドキュメント。コミットメッセージ。ChatGPT、 Claude、Copilot Chat に渡す AI プロンプト。

これらはすべて自然言語です。そしてどれも、コードを読んでいる頭から 文章を書く頭へ切り替える必要があり、その切り替えが開発フローを 中断させます。しかも、多くは打つより話すほうが速い。

コンテキストスイッチの問題

深いデバッグ中だとします。原因が分かり、「なぜこの修正で直るのか」を 将来の自分のためにコードコメントとして残したい。でも、 「アセンブリを読む」モードから「英語や日本語で説明を書く」モードへ 切り替えるにはコストがかかります。だから短すぎるコメントで済ませるか、 何も残さないまま終わりがちです。

音声入力はこの摩擦を消します。キーを押しながら考えていることを話し、 離す。それだけでコメントが出ます。エディタから離れず、手を キーボードから大きく外さず、思考の流れも切れません。

開発者ワークフローのどこで効くか

コードコメントとドキュメント

良いコードコメントは 何を ではなく なぜ を書くべきです。そして「なぜ」を説明するには、推論を言語化しなければ なりません。そこは本来、音声が得意な領域です。 「upstream API は毎週火曜 3am UTC のデプロイ中に 503 を返すので、 ここではリトライする」のようなコメントは、打つより話すほうが速く、 「失敗時にリトライ」よりはるかに価値があります。

AI プロンプト

ChatGPT、Claude、Cursor などを使うなら、プロンプトは常に書いています。 良いプロンプトは長くなります。文脈、制約、例、具体的な指示が必要だからです。 200 語のプロンプトを打つのに 2〜3 分かかるなら、話せば 45 秒で済みます。

ここで特に効くのが OnType の Compose モードです。修正や補足を混ぜながら 自然に話すだけで、AI リライトエンジンが構造化された明快なプロンプトへ 整えます。AI チャット画面にいることをシーン検出し、文脈と指示を分離し、 制約を明示し、会話的なノイズを落とした出力へ最適化します。

Git のコミットメッセージと PR 説明

「fix bug」というコミットメッセージは、たいてい コンテキストスイッチをしたくなかった人の産物です。音声入力なら、 「resize event 中に health check が timeout すると、2 本の goroutine が同じ connection を取得しうる race condition を修正」 のようなまともなメッセージを、数秒で残せます。

Slack と非同期コミュニケーション

技術判断を Slack で説明すると、3 段落必要になることが珍しくありません。 音声入力ならそれは 30 秒の口述になります。ここでも Compose モードは有効で、脱線や言い直しを含んだ生の説明から、 読みやすく構造化されたメッセージを生成できます。

ターミナルと CLI 入力

OnType は iTerm2、標準 Terminal、Warp などのターミナルエミュレータでも 動きます。つまり、長いコマンド引数、heredoc の中身、対話プロンプトへの 入力まで、声で入れられます。テキストは他のアプリと同様に、 カーソル位置へそのまま出ます。

なぜシステム全体で動く必要があるのか

音声ツールの中には、専用ウィンドウか一部アプリでしか使えないものがあります。 開発者にとって、それでは意味が薄い。目的は、今いる文脈を離れないことだからです。 エディタ、ターミナル、GitHub PR を開いたブラウザ。その場で使えなければ、 価値は大きく落ちます。

OnType はシステム全体で動作します。VS Code でホットキーを押せば VS Code に入り、iTerm2 なら iTerm2 に入り、Firefox の GitHub コメント欄ならそこへ入ります。別ウィンドウからのコピペも、 アプリ切り替えも要りません。

なぜオンデバイスである必要があるのか

開発者は、未公開コード、社内ドキュメント、機密性の高いプロジェクト情報を 扱うことが多いです。実装詳細を話している音声をクラウドへ送るのは、 不要なデータ露出面を増やすだけです。

OnType の標準エンジンは、Mac の Apple Silicon チップ上で完全に 動作します。内部 API の名前、アーキテクチャ判断、未公開機能名を含め、 あなたの音声はデバイスに残ります。

始めるには

1 日 1 時間以上、コード以外の文章を書いているなら、 OnType をダウンロード して 1 週間使ってみてください。 オンデバイスエンジンは無料です。変化はすぐ出ます。キーを押す、話す、 離す、そしてそのままコーディングを続けるだけです。

さらに詳しく知りたい場合は、 開発者向け音声入力のユースケース や、セットアップ方法を説明した スタートガイド を参照してください。