23 avr. 2026·Entreprise

Pourquoi vos données vocales ne devraient jamais quitter votre appareil

Lorsque vous utilisez un service de dictée cloud, votre voix quitte votre ordinateur. Elle traverse internet jusqu'à un centre de données, est traitée par un serveur que vous ne contrôlez pas, puis le texte revient. L'audio lui-même — votre voix réelle — peut être stocké, journalisé ou utilisé pour l'entraînement de modèles. Vous n'avez aucun moyen de vérifier ce qui lui arrive une fois parti.

Ce n'est pas hypothétique. Les grandes entreprises technologiques ont confirmé que des réviseurs humains écoutent des enregistrements d'assistants vocaux pour l'assurance qualité. Les fournisseurs ASR cloud conservent régulièrement l'audio pour améliorer leurs modèles, sauf si vous refusez explicitement — et même dans ce cas, les politiques de rétention sont enfouies dans des conditions d'utilisation qui changent sans préavis.

Nous avons conçu OnType pour faire disparaître entièrement ce problème.

La voix est une donnée biométrique

Votre voix n'est pas comme un message texte ou une requête de recherche. Elle transporte des informations biométriques — des motifs vocaux qui vous sont propres, votre état émotionnel, votre accent, votre rythme de parole. Elle est identifiable d'une manière que le texte saisi ne peut tout simplement pas atteindre.

Lorsqu'un service de dictée cloud traite votre audio, il ne reçoit pas seulement les mots que vous avez prononcés, mais aussi une signature biométrique pouvant servir à vous identifier, vous profiler et vous suivre. L'agrégation des données vocales au fil des sessions construit une empreinte de plus en plus détaillée.

Pour les particuliers, c'est un problème de vie privée. Pour les professionnels manipulant des informations confidentielles — avocats, médecins, conseillers financiers — c'est un risque de conformité.

Les trois problèmes du traitement cloud

1. Vous perdez le contrôle de vos données

Une fois que l'audio quitte votre appareil, vous faites confiance à l'infrastructure, aux employés et aux politiques du fournisseur. Les fuites de données touchent même les entreprises les plus attentives à la sécurité. Des injonctions peuvent forcer la divulgation d'audio stocké. Et des acquisitions d'entreprises peuvent transférer vos données à des entités dont les standards de confidentialité diffèrent de ceux du fournisseur d'origine.

2. La latence obéit aux lois de la physique

Le traitement cloud introduit un aller-retour réseau incompressible. Même avec une connexion rapide, vous ajoutez 100 à 300 ms de latence en plus du temps de traitement. Sur des connexions plus lentes ou derrière un VPN, le délai s'aggrave. Et si vous êtes hors ligne — dans un avion, dans une zone de mauvaise réception ou simplement déconnecté par choix — la dictée cloud ne fonctionne plus du tout.

Le traitement sur l'appareil élimine complètement le réseau. La reconnaissance vocale d'OnType fonctionne sur le Neural Engine des Mac Apple Silicon avec une latence inférieure à 200 ms. Elle fonctionne de la même manière, que vous soyez connecté à internet ou non.

3. Vous payez pour le calcul de quelqu'un d'autre

L'ASR cloud coûte cher à exploiter. Les fournisseurs répercutent ce coût sur les utilisateurs via des abonnements, une tarification à la minute ou des plafonds d'usage. Plus vous l'utilisez, plus vous payez — et plus vous envoyez d'audio vers leurs serveurs.

Le traitement sur l'appareil utilise un matériel que vous possédez déjà. Le Neural Engine de votre Mac est là, conçu précisément pour l'inférence en apprentissage automatique, et attend d'être utilisé. Le moteur local d'OnType est gratuit pour toujours — pas de limites d'usage, pas d'abonnement requis pour la saisie vocale de base.

Comment OnType garde tout en local

OnType est livré avec des modèles MLX quantifiés optimisés pour Apple Silicon. Lorsque vous maintenez votre raccourci et parlez, l'audio est capté par le microphone de votre Mac, traité par le moteur de reconnaissance vocale local, puis inséré comme texte à votre curseur. À aucun moment l'audio ou la transcription ne quittent votre machine.

L'architecture technique est simple : tampon audio → inférence MLX sur le Neural Engine → normalisation du texte → insertion au curseur. Il n'y a pas de pile réseau dans ce chemin. Aucune télémétrie sur le contenu de votre parole. Aucun serveur à compromettre.

Pour les utilisateurs qui veulent accéder aux modèles cloud les plus puissants — par exemple dans des environnements extrêmement bruyants ou avec un vocabulaire spécialisé — OnType propose un Cloud Engine optionnel. Mais le chemin par défaut reste toujours local, toujours privé et toujours disponible hors ligne.

La confidentialité comme architecture, pas comme politique

La plupart des services cloud promettent la confidentialité par une politique : "nous ne regarderons pas vos données". C'est une garantie juridique, pas technique. Elle peut être modifiée, violée ou contournée.

Le traitement sur l'appareil fournit la confidentialité par l'architecture. Il n'y a pas de données à compromettre parce qu'elles ne quittent jamais l'appareil. Il n'y a pas de politique à changer parce qu'il n'y a pas de collecte côté serveur à encadrer. La garantie est structurelle — elle est imposée par l'absence de chemin réseau, pas par une promesse dans des conditions d'utilisation.

C'est pour cela que nous avons construit OnType ainsi. Non pas parce que le traitement cloud est intrinsèquement mauvais — il a des avantages réels en précision et en taille de modèle. Mais parce que la voix est trop personnelle, trop identifiable et trop sensible pour être confiée à une infrastructure que vous ne contrôlez pas.

Votre voix devrait rester sur votre appareil. Cela ne devrait pas être une option à activer. Cela devrait être le comportement par défaut.

Essayez OnType — la saisie vocale sur l'appareil pour macOS, gratuite à vie pour le traitement local.