GPT-5.4 Mini en ligne ! La vitesse d'exécution est doublée, les petits modèles sont plus pratiques

MarketWhisper

2026-03-18 05:12:09

OpenAI le 18 mars a publié GPT-5.4 Mini et GPT-5.4 Nano, deux modèles légers conçus pour des charges de travail AI à haute capacité, en itérant à nouveau moins de deux semaines après le lancement de la version phare GPT-5.4. GPT-5.4 Mini est deux fois plus rapide que la précédente GPT-5 Mini, tandis que GPT-5.4 Nano est optimisé à moindre coût pour des scénarios de dialogue en temps réel.

La logique centrale des petits modèles : la précision n’est pas toujours la limite

OpenAI positionne GPT-5.4 Mini et Nano comme « les modèles les plus puissants de petite taille à ce jour », mais cela ne signifie pas qu’ils sont des versions réduites du modèle phare. Ils sont conçus selon des priorités différentes : lorsque le véritable goulot d’étranglement est la vitesse et le coût, plutôt que la profondeur de raisonnement, des modèles plus petits sont souvent plus pratiques.

Prenons l’exemple d’un système de service client : répondre à 200 questions fixes par jour, avec un raisonnement de niveau doctorat, offre un rendement marginal presque nul. La clé pour une mise à l’échelle du système réside dans une réponse en moins d’une seconde et un coût par réponse inférieur à un millième de dollar.

Actuellement, une architecture de flux de travail efficace consiste à faire en sorte que le modèle phare (comme GPT-5.4) gère la planification et la coordination des tâches, tandis que Mini ou Nano traitent en parallèle de nombreuses tâches répétitives — par exemple, la recherche dans une base de code, la lecture de documents ou le traitement de formulaires. Jerry Ma, vice-président technique de Perplexity, a déclaré après tests : « Mini a une forte capacité de raisonnement, et Nano répond rapidement et efficacement, ce qui le rend adapté aux flux de dialogue en temps réel. »

Données de référence : Mini dépasse déjà les standards humains en opération informatique

(Source : OpenAI)

Selon les données de référence publiques, la performance de GPT-5.4 Mini est déjà très proche de celle du modèle phare :

SWE-Bench Pro (évalue la capacité à corriger des problèmes réels de code sur GitHub) : GPT-5.4 Mini obtient 54,4 % ; l’ancienne GPT-5 Mini 45,7 % ; GPT-5.4 flagship 57,7 %

OSWorld-Verified (évalue la capacité à manipuler réellement le bureau via captures d’écran) : Mini 72,1 % ; GPT-5.4 flagship 75,0 % ; la norme humaine 72,4 % — Mini dépasse déjà la norme humaine

GPT-5.4 Nano : SWE-Bench Pro 52,4 %, OSWorld-Verified 39,0 %, inférieur à Mini, mais toujours une avancée significative par rapport à la génération Nano précédente

Ces données montrent que dans des scénarios nécessitant une manipulation de bureau ou un traitement de code, Mini rivalise presque avec la version phare ; Nano, bien que moins précis, offre encore un avantage en termes de coût dans des scénarios exigeant une réponse immédiate.

Structure tarifaire et disponibilité : différentes entrées pour développeurs et utilisateurs

Tarification API : GPT-5.4 Mini à 0,75 $ pour un million de tokens d’entrée, 4,50 $ pour un million de tokens de sortie ; GPT-5.4 Nano à 0,20 $ pour un million de tokens d’entrée, 1,25 $ pour un million de tokens de sortie — le prix d’entrée de Nano est environ un quart de celui de Mini.

Accessibilité pour l’utilisateur : GPT-5.4 Mini est déjà accessible aux utilisateurs de ChatGPT Free et Go via l’option « + » dans le menu « Penser » ; lorsque les utilisateurs payants atteignent la limite d’utilisation de GPT-5.4, le système bascule automatiquement vers Mini. GPT-5.4 Nano est actuellement uniquement accessible via API, destiné aux développeurs, et non directement aux consommateurs.

Questions fréquentes

Quelle est la principale différence entre GPT-5.4 Mini et GPT-5.4 flagship ?

GPT-5.4 Mini est plus de deux fois plus rapide que la version précédente GPT-5 Mini, avec un score de 72,1 % dans le test OSWorld-Verified, dépassant la norme humaine de 72,4 %, et proche du 75,0 % du modèle phare. La différence principale réside dans la profondeur de raisonnement et la capacité à traiter des tâches complexes, mais la vitesse et le coût avantageux de Mini le rendent plus pratique pour de nombreuses tâches répétitives.

Quels sont les meilleurs cas d’utilisation de GPT-5.4 Nano ?

GPT-5.4 Nano est destiné aux outils pour développeurs via API, idéal pour des flux de dialogue légers nécessitant une réponse immédiate, comme un service client en temps réel ou des requêtes automatisées quotidiennes à grande échelle. Son prix d’entrée de 0,20 $ par million de tokens rend son déploiement à grande échelle économiquement viable pour les startups.

Comment utiliser GPT-5.4 Mini dans ChatGPT ?

GPT-5.4 Mini est déjà accessible aux utilisateurs de ChatGPT Free et Go via l’option « + » dans l’interface ChatGPT, sous « Penser ». Les utilisateurs payants, lorsqu’ils atteignent la limite d’utilisation de GPT-5.4, seront automatiquement basculés vers la version Mini.

Voir l'original

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Commentaire

0/400

Aucun commentaire