GPT-4.5, la nouvelle avancée d’OpenAI

OpenAI a récemment dévoilé GPT-4.5, son modèle d’IA le plus avancé à ce jour. Présenté comme une évolution majeure de GPT-4o, ce modèle se distingue par une compréhension affinée du langage naturel, une meilleure gestion des nuances et des performances accrues dans divers domaines tels que la programmation, la rédaction et la prise de décision. OpenAI le décrit comme le premier modèle offrant une interaction aussi fluide et « humaine », mais aussi comme l’un des plus coûteux en termes d’entraînement et d’exploitation. Ce dossier explore en profondeur ses caractéristiques, ses performances et ses implications.

1. Une architecture optimisée pour plus de performances

1.1 Un modèle plus grand et mieux entraîné

GPT-4.5 a été conçu en repoussant encore plus loin les limites du pré-entraînement non supervisé et du reasoning en chaîne de pensée (chain-of-thought). Ce dernier point est particulièrement important, car il permet au modèle de réfléchir avant de répondre, améliorant ainsi sa capacité à traiter des problèmes complexes en mathématiques, en logique et en sciences.

Le modèle a été entraîné sur un ensemble de données plus diversifié et plus volumineux que son prédécesseur, incluant des données publiques, des jeux de données propriétaires et des corpus développés en interne. L’accent a été mis sur l’amélioration de la capacité d’association et de compréhension contextuelle.

Score des évaluations des différents modèles OpenAI

	GPT‑4.5	GPT‑4o	OpenAI o3‑mini (high)
GPQA (science)	71.4%	53.6%	79.7%
AIME ‘24 (math)	36.7%	9.3%	87.3%
MMMLU (multilingual)	85.1%	81.5%	81.1%
MMMU (multimodal)	74.4%	69.1%	–
SWE-Lancer Diamond (coding)*	32.6%$186,125	23.3%$138,750	10.8%$89,625
SWE-Bench Verified (coding)*	38.0%	30.7%	61.0%

1.2 Alignement et compréhension des intentions humaines

Une innovation majeure de GPT-4.5 repose sur de nouvelles techniques d’alignement qui lui permettent de mieux comprendre les intentions humaines. Grâce à des techniques avancées de supervised fine-tuning (SFT) et de reinforcement learning from human feedback (RLHF), le modèle peut offrir des réponses plus précises, mieux nuancées et éviter les biais habituels.

Les premiers tests montrent que GPT-4.5 se distingue par son ton plus naturel et chaleureux, ainsi que par sa capacité à interpréter les émotions et à adapter son style de réponse en conséquence.

2. Comparaison des performances : GPT-4.5 vs GPT-4o

2.1 Tests sur la précision et les hallucinations

Résultats des tests PersonQA (évaluation de l’exactitude des réponses sur des faits concernant des personnes) :

Modèle	Précision (%)	Taux d’hallucination (%)
GPT-4o	28	52
o1	55	20
GPT-4.5	78	19

Les résultats montrent une nette amélioration de la précision des réponses, avec une diminution des hallucinations, un problème récurrent des IA conversationnelles.

2.2 Résistance aux jailbreaks

L’évaluation de la robustesse face aux tentatives de contournement a été un axe central des tests de sécurité. GPT-4.5 affiche une amélioration sur les attaques de type StrongReject, un benchmark académique de tests adversariaux.

Modèle	Résistance aux jailbreaks (%)
GPT-4o	37
o1	87
GPT-4.5	99

GPT-4.5 parvient donc mieux que GPT-4o à refuser des requêtes interdites, réduisant ainsi les risques d’utilisation abusive.

3. Coûts et accessibilité

L’une des critiques majeures à l’égard de GPT-4.5 concerne son coût d’utilisation élevé.

Prix API : 75 $ par million de tokens en entrée et 150 $ par million de tokens en sortie, bien plus cher que GPT-4o.
Accès limité : Disponible uniquement pour les abonnés ChatGPT Pro (200 $/mois) en avant-première.
OpenAI prévoit d’étendre progressivement l’accès, mais en limitant l’exploitation via l’API pour maîtriser les coûts.

4. Capacité de persuasion et risques potentiels

Un point d’attention soulevé par les experts est la capacité de GPT-4.5 à manipuler ou persuader d’autres IA.

Test « MakeMePay » (capacité à convaincre une IA de faire un paiement) :

Modèle	% de paiements reçus	% du montant extrait
GPT-4o	50 %	18 %
o1	63 %	24 %
GPT-4.5	57 %	21 %

GPT-4.5 excelle dans la modulation de ses réponses pour paraître plus convaincant, ce qui soulève des interrogations quant à son usage dans des contextes de manipulation.

5. Perspectives d’avenir

Si GPT-4.5 marque une amélioration notable par rapport à GPT-4o, il ne représente pas une rupture technologique majeure. Il pose aussi des questions de coût et d’accessibilité.

Points forts :

✅ Meilleure compréhension contextuelle et réduction des erreurs ✅ Amélioration de la robustesse face aux jailbreaks ✅ Interaction plus fluide et « humaine »

Limites :

❌ Prix d’accès élevé, restreint aux abonnés premium ❌ Coût d’API prohibitif pour de nombreux usages ❌ Augmentation des capacités persuasives, pouvant poser des risques éthiques

À suivre : OpenAI envisage d’intégrer GPT-4.5 dans des produits tels que ChatGPT Enterprise et d’autres solutions B2B. Cependant, la communauté attend avec impatience GPT-5, qui pourrait, cette fois, représenter une véritable révolution.