ブログ

音声入力、エンジニアリング、そして OnType を作る過程についての考察。

話し言葉をきれいな文字列へ: Inverse Text Normalization の仕組み

「three thousand dollars」と言ったら「$3,000」と出てほしいはずです。これが inverse text normalization であり、私たちは多言語で正しく動かすために独自エンジンを一から作りました。

エンジニアリング·

Apple Silicon 上の MLX でオンデバイス音声認識を構築する

私たちが mlx-swift-asr をどう作ったかを解説します。これは Qwen3-ASR を Apple Silicon 上で 4〜6 倍速のリアルタイム性能で動かし、クラウド依存をゼロにするオープンソースのネイティブ Swift ライブラリです。

エンジニアリング·

開発者のための音声入力: ボイスコーディング、AI プロンプト、ターミナル入力

開発者が日々のワークフローで音声入力をどう使うかを解説します。コードコメントやドキュメントの記述から、AI プロンプトやターミナルコマンドの作成までを扱います。

プロダクト·

なぜ音声データはデバイスの外に出るべきではないのか

音声は生体データです。多くのディクテーションツールはそれをクラウドへ送ります。OnType が音声を Mac 上だけで処理する理由を説明します。

会社·

macOS の音声入力完全ガイド

macOS の音声入力で知っておくべきことをまとめました。標準ディクテーション、サードパーティ製ツール、設定のコツ、そして自分のワークフローに合う選び方までを解説します。

プロダクト·

OnType 1.0 — あなたの声が、そのままキーボードになる

OnType 1.0 が登場。Push-to-Talk で即時ディクテーション、Compose で AI が長文を整え、Translate で二言語を自然に切り替え。すべて Mac 上でローカルに動作します。

プロダクト·

OnType を使い始める

OnType のセットアップ方法と、Mac で音声入力を始める手順を紹介します。

プロダクト·