L'IA smartphone : trois niveaux de réalité

Les fonctionnalités d'IA dans les smartphones se déclinent en trois catégories selon leur lieu d'exécution : on-device (sur la puce), on-device + cloud hybride, ou purement cloud avec le téléphone comme terminal. Ces distinctions ont des implications majeures pour la confidentialité, la vitesse et la disponibilité hors connexion.

Les puces neuronales : NPU, DSP et GPU

Le terme NPU (Neural Processing Unit) désigne un processeur optimisé pour les calculs de réseaux de neurones (multiplications matricielles massivement parallèles). En 2025, les principaux SoC embarquent :

Apple A18 Pro (iPhone 16 Pro) : NPU 16 cœurs, 38 TOPS. Exécute des modèles de langage jusqu'à 3B paramètres en local.
Google Tensor G4 (Pixel 9 Pro) : Tensor Processing Unit optimisé pour Gemini Nano. 17 TOPS.
Qualcomm Snapdragon 8 Gen 3 / Elite : Hexagon NPU, 45-75 TOPS selon la version. Architecture hétérogène CPU+GPU+NPU.
Samsung Exynos 2500 : NPU 34,4 TOPS, capable d'exécuter des modèles LLM 7B quantifiés.

Ce qui fonctionne vraiment en on-device

Transcription vocale en temps réel : modèles Whisper-like (100-200M paramètres) — fiable et hors ligne.
Résumé de conversation / email : LLM 1-3B paramètres quantifiés en INT4. Qualité correcte.
Gomme magique / édition photo IA : segmentation sémantique, inpainting — fonctionne très bien on-device.
Traduction temps réel : modèles NMT (Neural Machine Translation) embarqués — excellents sur les grandes langues.
Reconnaissance d'objet dans les photos : efficace, rapide, hors connexion.

Ce qui nécessite encore le cloud

Génération d'image réaliste : les modèles diffusion de haute qualité (SDXL, FLUX) nécessitent des GPU de datacenter.
Réponses complexes de type ChatGPT : les modèles 70B+ paramètres ne tiennent pas en mémoire mobile.
Apple Intelligence avancé : les fonctions complexes (analyse de documents longs, Private Cloud Compute) délèguent au cloud Apple sécurisé.

La confidentialité : l'argument décisif pour le on-device

L'IA on-device traite vos données sans les envoyer sur un serveur externe. Apple le formalise avec Private Cloud Compute (données chiffrées, serveurs vérifiables). Google Gemini Nano sur Pixel traite les données personnelles localement. C'est un argument fort face aux assistants cloud où vos conversations sont potentiellement utilisées pour l'entraînement.

Notre verdict

En 2025, l'IA embarquée est une réalité pour les tâches de traitement du langage léger, de l'image et de la voix. Le marketing exagère souvent les capacités — mais les transcriptions vocales, l'édition photo IA et les résumés de texte sont genuinement utiles et fonctionnent bien. L'IA générative créative de haute qualité reste domaine du cloud.

Nos Services