Aller au contenu

« GPT-4o » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Alenoach (discuter | contributions)
Suppression d'une phrase redondante et modification d'une autre
Alenoach (discuter | contributions)
Reformulations et références
Ligne 11 : Ligne 11 :


== Test de pré-lancement ==
== Test de pré-lancement ==
GPT-4o a été initialement lancé sur [[LMSYS]], sous la forme de trois modèles différents : ''gpt2-chatbot'', ''im-a-good-gpt2-chatbot'' et ''im-also-a-good-gpt2-chatbot''. Le 7 mai 2024, [[Sam Altman]] a publié le tweet {{Citation|im-a-good-gpt2-chatbot}}, interprété comme une confirmation du fait qu'[[OpenAI]] était responsable de ces nouveaux modèles (alors mystérieux) et effectuait des [[Test A/B|tests A/B]].<ref>{{Lien web |langue=en |prénom=Carl |nom=Franzen |titre=OpenAI announces new free model GPT-4o and ChatGPT for desktop |url=https://venturebeat.com/ai/openai-announces-new-free-model-gpt-4o-and-chatgpt-for-desktop/ |date=2024-05-13 |consulté le=2024-05-18}}</ref> Notons que la démo a eu lieu la veille de la keynote de [[Google]], concurrent d'OpenAI dans les domaines des [[LLM (modèle de langage)|LLM]].
GPT-4o a été initialement lancé sur [[LMSYS]], sous la forme de trois modèles différents : ''gpt2-chatbot'', ''im-a-good-gpt2-chatbot'' et ''im-also-a-good-gpt2-chatbot''. Le 7 mai 2024, [[Sam Altman]] a publié le tweet {{Citation|im-a-good-gpt2-chatbot}}, interprété comme une confirmation du fait qu'[[OpenAI]] était responsable de ces nouveaux modèles (alors mystérieux) et effectuait des [[Test A/B|tests A/B]].<ref>{{Lien web |langue=en |prénom=Carl |nom=Franzen |titre=OpenAI announces new free model GPT-4o and ChatGPT for desktop |url=https://venturebeat.com/ai/openai-announces-new-free-model-gpt-4o-and-chatgpt-for-desktop/ |date=2024-05-13 |consulté le=2024-05-18}}</ref> Notons que la démo a eu lieu la veille de [[Google I/O]], une conférence où [[Google]] annonce de nouveaux produits, Google étant un des principaux concurrents de OpenAI dans les domaines des [[LLM (modèle de langage)|LLM]]<ref>{{Lien web |langue=en |auteur=Sumeet Wadhwani |titre=AI Galore: Key Announcements From Google I/O 2024 |url=https://www.spiceworks.com/tech/tech-general/articles/google-io-2024-highlights/ |site=Spiceworks |date=15 mai 2024 |consulté le=2024-05-18}}</ref>.


== Capacités ==
== Capacités ==
GPT-4o a obtenu des résultats de pointe en matière de références vocales, multilingues et visuelles, établissant de nouveaux records en matière de reconnaissance vocale et de traduction audio. GPT-4o a obtenu un score de 88,7 % au [[test de performance]] ''Massive Multitask Language Understanding'' (MMLU), contre 86,5 % pour GPT-4 Turbo. Pour le speech-to-speech, contrairement à GPT-3.5 et GPT-4 qui convertissent la voix en texte, donnent le texte au modèle puis reconvertissent le texte en voix à l'aide d'un autre modèle, GPT-4o prend en charge nativement la création de speech-to-speech dans ses [[Plongement lexical|embeddings]]. (Remarque : cette fonctionnalité n'a pas encore été publiée, la fonctionnalité vocale de l'application ChatGPT est toujours l'ancienne version)
GPT-4o a obtenu des résultats de pointe sur des tests de performance en qualité vocale, vision et multilinguisme. Il a établi de nouveaux records en reconnaissance vocale et en traduction<ref>{{Lien web |langue=en |prénom=Ryan |nom=Daws |titre=GPT-4o delivers human-like AI interaction with text, audio, and vision integration |url=https://www.artificialintelligence-news.com/2024/05/14/gpt-4o-human-like-ai-interaction-text-audio-vision-integration/ |site=AI news |date=2024-05-14 |consulté le=2024-05-18}}</ref>{{,}}<ref>{{Lien web |langue=en |titre=OpenAI Launched GPT-4o: The Future of AI Interactions Is Here |url=https://www.thedigitalspeaker.com/openai-gpt4o-future-ai-interactions/ |site=The digital speaker |date=2024-05-13 |consulté le=2024-05-18}}</ref>. GPT-4o a atteint un score de 88,7 % au [[test de performance]] ''Massive Multitask Language Understanding'' (MMLU), contre 86,5 % pour GPT-4 Turbo. Contrairement à GPT-3.5 et GPT-4, qui dépendent d'autres modèles pour traiter le son, GPT-4o prend en charge nativement les conversations voix-à-voix, rendant les réponse plus rapides (Remarque : cette fonctionnalité n'a pas encore été publiée, la fonctionnalité vocale de l'application ChatGPT est toujours l'ancienne version<ref name=":0" />).


Le modèle prend en charge plus de 50 langues<ref name="TechCrunch" />, couvrant plus de 97 % des locuteurs. Mira Murati a démontré la capacité multilingue du modèle en parlant italien au modèle et en le faisant traduire entre l'anglais et l'italien lors de l'événement de démonstration OpenAI diffusé en direct le 13 mai 2024. De plus, le nouveau tokenizer utilise moins de tokens pour certaines langues, en particulier les langues qui ne sont pas basées sur l'alphabet latin, ce qui le rend moins cher pour ces langues.
Le modèle prend en charge plus de 50 langues<ref name="TechCrunch" />, couvrant plus de 97 % des locuteurs. Mira Murati a démontré la capacité multilingue du modèle en parlant italien au modèle et en le faisant traduire entre l'anglais et l'italien lors de l'événement de démonstration OpenAI diffusé en direct le 13 mai 2024. De plus, le nouveau tokenizer utilise moins de tokens pour certaines langues, en particulier les langues qui ne sont pas basées sur l'alphabet latin, ce qui le rend moins cher pour ces langues.
Ligne 20 : Ligne 20 :
À son lancement en mai 2024, GPT-4o est le meilleur grand modèle de langage du classement [[Classement Elo|Elo]] de LMSYS, avec un avantage particulièrement significatif en [[programmation informatique]]<ref>{{Lien web |langue=en |prénom=Carl |nom=Franzen |titre=OpenAI announces new free model GPT-4o and ChatGPT for desktop |url=https://venturebeat.com/ai/openai-announces-new-free-model-gpt-4o-and-chatgpt-for-desktop/ |site=VentureBeat |date=2024-05-13 |consulté le=2024-05-18}}</ref>.
À son lancement en mai 2024, GPT-4o est le meilleur grand modèle de langage du classement [[Classement Elo|Elo]] de LMSYS, avec un avantage particulièrement significatif en [[programmation informatique]]<ref>{{Lien web |langue=en |prénom=Carl |nom=Franzen |titre=OpenAI announces new free model GPT-4o and ChatGPT for desktop |url=https://venturebeat.com/ai/openai-announces-new-free-model-gpt-4o-and-chatgpt-for-desktop/ |site=VentureBeat |date=2024-05-13 |consulté le=2024-05-18}}</ref>.


Le nouveau tokenizer réduit pour plusieurs langues le nombre de [[Analyse lexicale|tokens]] nécessaires pour encoder des phrases, diminuant ainsi les coûts. En particulier pour les langues qui ne sont pas basées sur l'[[alphabet latin]]<ref>{{Lien web |langue=en |titre=Hello GPT-4o |url=https://openai.com/index/hello-gpt-4o/ |site=OpenAI |date=13 mai 2024}}</ref>.
Le nouveau tokenizer réduit pour plusieurs langues le nombre de [[Analyse lexicale|tokens]] nécessaires pour encoder des phrases, diminuant ainsi les coûts. En particulier pour les langues qui ne sont pas basées sur l'[[alphabet latin]]<ref name=":0">{{Lien web |langue=en |titre=Hello GPT-4o |url=https://openai.com/index/hello-gpt-4o/ |site=OpenAI |date=13 mai 2024}}</ref>.


== Voir également ==
== Voir également ==

Version du 18 mai 2024 à 19:49

GPT-4o

Informations
Développé par OpenAI
Première version [1]Voir et modifier les données sur Wikidata
Langues MultilingueVoir et modifier les données sur Wikidata
Type Transformateur pré-entraîné génératif (LLM)
Licence Licence propriétaireVoir et modifier les données sur Wikidata
Site web openai.com/gpt-4o

Chronologie des versions

GPT-4o (abréviation de « GPT-4 omni ») est un transformateur pré-entraîné génératif (grand modèle de langage, ou LLM) multilingue et multimodal conçu par l'entreprise OpenAI. Ce modèle a été annoncé par Mira Murati, CTO d'OpenAI, lors d'une démo diffusée en direct le 13 mai 2024, et intégré à ChatGPT le même jour. Son API est deux fois plus rapide que son prédécesseur, GPT-4 Turbo[2].

Test de pré-lancement

GPT-4o a été initialement lancé sur LMSYS, sous la forme de trois modèles différents : gpt2-chatbot, im-a-good-gpt2-chatbot et im-also-a-good-gpt2-chatbot. Le 7 mai 2024, Sam Altman a publié le tweet « im-a-good-gpt2-chatbot », interprété comme une confirmation du fait qu'OpenAI était responsable de ces nouveaux modèles (alors mystérieux) et effectuait des tests A/B.[3] Notons que la démo a eu lieu la veille de Google I/O, une conférence où Google annonce de nouveaux produits, Google étant un des principaux concurrents de OpenAI dans les domaines des LLM[4].

Capacités

GPT-4o a obtenu des résultats de pointe sur des tests de performance en qualité vocale, vision et multilinguisme. Il a établi de nouveaux records en reconnaissance vocale et en traduction[5],[6]. GPT-4o a atteint un score de 88,7 % au test de performance Massive Multitask Language Understanding (MMLU), contre 86,5 % pour GPT-4 Turbo. Contrairement à GPT-3.5 et GPT-4, qui dépendent d'autres modèles pour traiter le son, GPT-4o prend en charge nativement les conversations voix-à-voix, rendant les réponse plus rapides (Remarque : cette fonctionnalité n'a pas encore été publiée, la fonctionnalité vocale de l'application ChatGPT est toujours l'ancienne version[7]).

Le modèle prend en charge plus de 50 langues[2], couvrant plus de 97 % des locuteurs. Mira Murati a démontré la capacité multilingue du modèle en parlant italien au modèle et en le faisant traduire entre l'anglais et l'italien lors de l'événement de démonstration OpenAI diffusé en direct le 13 mai 2024. De plus, le nouveau tokenizer utilise moins de tokens pour certaines langues, en particulier les langues qui ne sont pas basées sur l'alphabet latin, ce qui le rend moins cher pour ces langues.

À son lancement en mai 2024, GPT-4o est le meilleur grand modèle de langage du classement Elo de LMSYS, avec un avantage particulièrement significatif en programmation informatique[8].

Le nouveau tokenizer réduit pour plusieurs langues le nombre de tokens nécessaires pour encoder des phrases, diminuant ainsi les coûts. En particulier pour les langues qui ne sont pas basées sur l'alphabet latin[7].

Voir également

Références

  1. (en) « OpenAI launches new AI model GPT-4o and desktop version of ChatGPT »,
  2. a et b (en-US) Wiggers, « OpenAI debuts GPT-4o 'omni' model now powering ChatGPT », TechCrunch, (consulté le )
  3. (en) Carl Franzen, « OpenAI announces new free model GPT-4o and ChatGPT for desktop », (consulté le )
  4. (en) Sumeet Wadhwani, « AI Galore: Key Announcements From Google I/O 2024 », sur Spiceworks, (consulté le )
  5. (en) Ryan Daws, « GPT-4o delivers human-like AI interaction with text, audio, and vision integration », sur AI news, (consulté le )
  6. (en) « OpenAI Launched GPT-4o: The Future of AI Interactions Is Here », sur The digital speaker, (consulté le )
  7. a et b (en) « Hello GPT-4o », sur OpenAI,
  8. (en) Carl Franzen, « OpenAI announces new free model GPT-4o and ChatGPT for desktop », sur VentureBeat, (consulté le )