OpenAI a annoncé l’arrivée de trois nouveaux modèles : GPT-4.1, GPT-4.1 mini et GPT-4.1 nano, qui promettent d’amener l’intelligence artificielle à un nouveau niveau. Avec des fenêtres de contexte allant jusqu’à 1 million de tokens et une coupure de connaissance qui s’étend jusqu’en juin 2024, ces modèles sont conçus pour surpasser leurs prédécesseurs.
Selon la société, GPT-4.1 et ses variantes dépasse le GPT-4o récemment mis à jour, offrant une performance API exclusive en ce moment, donc il ne sera pas intégré dans ChatGPT immédiatement. Les données de performance sont impressionnantes : une augmentation de 21,4 % du score SWE-bench Verified et un record dans la compréhension de vidéos longues.
Améliorations de la performance et de la vitesse
OpenAI ne s’est pas seulement concentré sur la précision, mais aussi sur la vitesse. Le modèle GPT-4.1 renvoie son premier token en environ 15 secondes en traitant 128 000 tokens, et jusqu’à 30 secondes pour un million. Les versions mini et nano sont encore plus rapides, avec des réponses en moins de 5 secondes pour des entrées similaires.
Pour son utilisation dans des cas du monde réel, OpenAI a collaboré avec des partenaires comme Thomson Reuters, qui a rapporté une augmentation de 17 % de la précision de révision des documents juridiques en utilisant GPT-4.1. D’autre part, Carlyle a constaté que le nouveau modèle est 50 % plus efficace dans l’extraction de données de documents complexes.
L’intelligence visuelle a également considérablement amélioré. Dans plusieurs benchmarks de vision, GPT-4.1 mini a montré une performance supérieure à celle de son prédécesseur dans de multiples tâches. Cela signifie que la compréhension des images est désormais plus avancée, élargissant les possibilités pour les développeurs et les entreprises.
En termes de coûts, l’utilisation de mise en cache des prompts et de l’API Batch peut réduire encore plus les dépenses, ce qui est attrayant pour des applications à grande échelle. Avec le retrait du programme de prévisualisation GPT-4.5 prévu pour juillet 2025, OpenAI se concentre sur l’offre d’une performance plus solide et rentable grâce à GPT-4.1.