工程 相关文章
当你说出 “three thousand dollars” 时,你期待看到的是 “$3,000”,而不是字面文字。这就是逆文本规范化。为了让它跨语言稳定工作,我们从头构建了一套自定义引擎。
我们如何构建 mlx-swift-asr:一个开源、原生 Swift 语音识别库,可在 Apple Silicon 上以 4 到 6 倍实时速度运行 Qwen3-ASR,且完全不依赖云端。