Jeudi, OpenAI a annoncé le lancement de son nouveau modèle d’intelligence artificielle, appelé o1, conçu pour traiter des tâches plus complexes dans les domaines des sciences, du codage et des mathématiques, tout en améliorant ses capacités de raisonnement.
Connu sous le nom de Projet Strawberry, o1 est en réalité une famille de modèles entraînés pour répondre à des questions complexes, et ce, plus rapidement qu’un être humain. Deux versions de ce modèle sont déjà disponibles via ChatGPT et l’API d’OpenAI : o1-preview et o1-mini, ce dernier étant un modèle plus petit et optimisé pour la génération de code. Pour accéder à o1 sur ChatGPT, un abonnement à ChatGPT Plus ou Team est requis. Les utilisateurs des versions Entreprise et Education auront accès à ces modèles dès le début de la semaine prochaine.
Dans un communiqué, OpenAI explique : « Nous avons entraîné ces modèles à prendre plus de temps pour réfléchir aux problèmes avant de répondre, comme le ferait une personne. Grâce à cet entraînement, ils apprennent à affiner leur processus de réflexion, à explorer différentes stratégies et à reconnaître leurs erreurs. »
Traditionnellement, les modèles d’IA produisent parfois des réponses inexactes ou incohérentes, connues sous le nom d’« hallucinations ». Ces erreurs surviennent car ces modèles se concentrent principalement sur la prédiction du prochain mot ou phrase probable, sans véritablement réfléchir à la manière de produire une réponse. Le modèle o1 d’OpenAI, quant à lui, est conçu pour adopter une approche plus réfléchie, ce qui permet d’obtenir des réponses plus précises.
Ce qui distingue o1 des autres modèles d’IA générative, selon OpenAI, est sa capacité à « réfléchir » avant de répondre aux questions. En prenant plus de temps pour analyser une requête, o1 est capable de se « vérifier » lui-même, en examinant attentivement chaque partie d’une question. Cela permet au modèle de mieux éviter les erreurs logiques qui affectent souvent d’autres IA.
Lorsqu’il dispose de plus de temps pour traiter une requête, o1 peut raisonner de manière plus holistique, en planifiant et en exécutant une série d’actions sur une période prolongée pour aboutir à une réponse. Il se révèle particulièrement adapté aux tâches nécessitant une synthèse de plusieurs sous-tâches, comme la détection de courriels privilégiés dans une boîte de réception juridique ou l’élaboration d’une stratégie de marketing.
Cependant, o1 est encore limité dans certaines de ses fonctionnalités. Contrairement à GPT-4o, il ne peut ni accéder à Internet ni analyser des fichiers pour l’instant. Bien que doté de capacités d’analyse d’images, ces fonctionnalités sont actuellement désactivées en attendant des tests supplémentaires. De plus, o1 a des contraintes de débit : les utilisateurs de o1-preview sont limités à 30 messages par semaine, tandis que ceux de o1-mini peuvent envoyer jusqu’à 50 messages hebdomadaires. En fonction des requêtes, o1 peut également être plus lent que d’autres modèles, prenant parfois plus de 10 secondes pour répondre, avec un affichage de la progression par sous-tâche.
Un autre inconvénient d’o1 est son coût. Sur l’API, o1-preview coûte 15 dollars pour 1 million de jetons d’entrée et 60 dollars pour 1 million de jetons de sortie, soit trois à quatre fois plus cher que GPT-4o. (À titre de référence, 1 million de jetons équivaut à environ 750 000 mots.)
Enfin, OpenAI a annoncé son intention de rendre o1-mini accessible aux utilisateurs de la version gratuite de ChatGPT, bien qu’aucune date de lancement officielle n’ait encore été communiquée.