
OpenAI le 18 mars a publié GPT-5.4 Mini et GPT-5.4 Nano, deux modèles légers conçus pour des charges de travail AI à haute capacité, en itérant à nouveau moins de deux semaines après le lancement de la version phare GPT-5.4. GPT-5.4 Mini est deux fois plus rapide que la précédente GPT-5 Mini, tandis que GPT-5.4 Nano est optimisé à moindre coût pour des scénarios de dialogue en temps réel.
OpenAI positionne GPT-5.4 Mini et Nano comme « les modèles les plus puissants de petite taille à ce jour », mais cela ne signifie pas qu’ils sont des versions réduites du modèle phare. Ils sont conçus selon des priorités différentes : lorsque le véritable goulot d’étranglement est la vitesse et le coût, plutôt que la profondeur de raisonnement, des modèles plus petits sont souvent plus pratiques.
Prenons l’exemple d’un système de service client : répondre à 200 questions fixes par jour, avec un raisonnement de niveau doctorat, offre un rendement marginal presque nul. La clé pour une mise à l’échelle du système réside dans une réponse en moins d’une seconde et un coût par réponse inférieur à un millième de dollar.
Actuellement, une architecture de flux de travail efficace consiste à faire en sorte que le modèle phare (comme GPT-5.4) gère la planification et la coordination des tâches, tandis que Mini ou Nano traitent en parallèle de nombreuses tâches répétitives — par exemple, la recherche dans une base de code, la lecture de documents ou le traitement de formulaires. Jerry Ma, vice-président technique de Perplexity, a déclaré après tests : « Mini a une forte capacité de raisonnement, et Nano répond rapidement et efficacement, ce qui le rend adapté aux flux de dialogue en temps réel. »
(Source : OpenAI)
Selon les données de référence publiques, la performance de GPT-5.4 Mini est déjà très proche de celle du modèle phare :
SWE-Bench Pro (évalue la capacité à corriger des problèmes réels de code sur GitHub) : GPT-5.4 Mini obtient 54,4 % ; l’ancienne GPT-5 Mini 45,7 % ; GPT-5.4 flagship 57,7 %
OSWorld-Verified (évalue la capacité à manipuler réellement le bureau via captures d’écran) : Mini 72,1 % ; GPT-5.4 flagship 75,0 % ; la norme humaine 72,4 % — Mini dépasse déjà la norme humaine
GPT-5.4 Nano : SWE-Bench Pro 52,4 %, OSWorld-Verified 39,0 %, inférieur à Mini, mais toujours une avancée significative par rapport à la génération Nano précédente
Ces données montrent que dans des scénarios nécessitant une manipulation de bureau ou un traitement de code, Mini rivalise presque avec la version phare ; Nano, bien que moins précis, offre encore un avantage en termes de coût dans des scénarios exigeant une réponse immédiate.
Tarification API : GPT-5.4 Mini à 0,75 $ pour un million de tokens d’entrée, 4,50 $ pour un million de tokens de sortie ; GPT-5.4 Nano à 0,20 $ pour un million de tokens d’entrée, 1,25 $ pour un million de tokens de sortie — le prix d’entrée de Nano est environ un quart de celui de Mini.
Accessibilité pour l’utilisateur : GPT-5.4 Mini est déjà accessible aux utilisateurs de ChatGPT Free et Go via l’option « + » dans le menu « Penser » ; lorsque les utilisateurs payants atteignent la limite d’utilisation de GPT-5.4, le système bascule automatiquement vers Mini. GPT-5.4 Nano est actuellement uniquement accessible via API, destiné aux développeurs, et non directement aux consommateurs.
GPT-5.4 Mini est plus de deux fois plus rapide que la version précédente GPT-5 Mini, avec un score de 72,1 % dans le test OSWorld-Verified, dépassant la norme humaine de 72,4 %, et proche du 75,0 % du modèle phare. La différence principale réside dans la profondeur de raisonnement et la capacité à traiter des tâches complexes, mais la vitesse et le coût avantageux de Mini le rendent plus pratique pour de nombreuses tâches répétitives.
GPT-5.4 Nano est destiné aux outils pour développeurs via API, idéal pour des flux de dialogue légers nécessitant une réponse immédiate, comme un service client en temps réel ou des requêtes automatisées quotidiennes à grande échelle. Son prix d’entrée de 0,20 $ par million de tokens rend son déploiement à grande échelle économiquement viable pour les startups.
GPT-5.4 Mini est déjà accessible aux utilisateurs de ChatGPT Free et Go via l’option « + » dans l’interface ChatGPT, sous « Penser ». Les utilisateurs payants, lorsqu’ils atteignent la limite d’utilisation de GPT-5.4, seront automatiquement basculés vers la version Mini.