Une nouvelle vague de modèles d’IA ouverts remet en cause la domination de l’OpenAI

Accueil · Blog IA · Nouvelles · Une nouvelle vague de modèles d’IA ouverts remet en cause la domination de l’OpenAI

L’intelligence artificielle générative vit une période fascinante. Avec le lancement récent de modèles d’IA open source tels que LLaMA 2 et ChatGLM, une nouvelle tendance à l’ouverture et à la démocratisation du domaine se dessine.

Le règne d’OpenAI et de ses alliés

Jusqu’à présent, OpenAI dominait nettement le marché des grands modèles linguistiques avec le GPT-3 et le récent GPT-4, considérés comme les plus avancés. Ses modèles sont fermés et OpenAI décide qui peut y accéder.

Mais même ses partenaires les plus proches, tels que Microsoft et Meta, adoptent désormais le mouvement open source, remettant en cause la domination d’OpenAI avec des alternatives telles que LLaMA 2.

La vague des modèles ouverts

Ces dernières semaines, de nombreuses annonces de nouveaux grands modèles d’IA open source ont été faites :

Meta a publié LLaMA 2, en partenariat avec Microsoft.
Alibaba Cloud a publié des modèles ouverts tels que Qwen-7B.
Baidu a ajouté 30 modèles open source à sa plateforme Wenxin Qianfan.

Pourquoi cette tendance à l’open source ?

Plusieurs raisons expliquent ce mouvement :

Encourager l’innovation

En publiant les modèles, davantage de développeurs peuvent expérimenter, créer de nouvelles applications et améliorer la technologie. C’est un peu comme Android par rapport à iOS.

Démontrer les capacités

L’ouverture du code permet de valider la qualité des modèles. Les entreprises veulent montrer qu’elles peuvent rivaliser avec OpenAI.

Agilité

Les modèles open source sont plus rapides à mettre à jour. Les développeurs préfèrent leur flexibilité.

Création d’écosystèmes

Un large écosystème autour de LLaMA 2 et d’autres modèles ouverts contribue à leur adoption rapide.

Grands modèles de langage (LLM) classés par capacité

Ce tableau présente un classement des meilleurs modèles d’IA conversationnelle par capacité.

Ces modèles d’IA sont formés pour être capables de tenir des conversations cohérentes et fluides comme s’ils étaient humains. Plus ils sont grands et avancés, plus ils sont intelligents et capables de tenir une conversation.

Le tableau présente des modèles bien connus, tels que GPT-4 d’OpenAI ou Claude d’Anthropic, ainsi que des modèles moins populaires.

Plusieurs mesures sont indiquées pour évaluer la capacité de chaque modèle :

Arena Elo Score : mesure la qualité de la conversation, telle qu’elle est jugée par des milliers d’utilisateurs réels. Plus le score est élevé, meilleur est le modèle conversationnel.
MT-bench score : évalue la capacité du modèle à répondre à des questions complexes à plusieurs tours.
MMLU : mesure la précision du modèle sur 57 tâches linguistiques différentes.

Il indique également si le modèle est open source ou propriétaire, c’est-à-dire si sa technologie est librement partagée ou si elle est détenue par une entreprise.

Le tableau vous permet de comparer les compétences conversationnelles et les performances des modèles d’IA les plus populaires afin de déterminer lesquels sont actuellement les plus puissants. Les modèles open source cherchent à démocratiser l’IA en la partageant librement.

Position	Modèle	Score Arena Elo	Score MT-bench	MMLU	Licence
1	GPT-4	1206	8.99	86.4	Propriétaire
2	Claude-1	1166	7.9	77	Propriétaire
3	Claude-instant-1	1138	7.85	73.4	Propriétaire
4	Claude-2	1135	8.06	78.5	Propriétaire
5	GPT-3.5-turbo	1122	7.94	70	Propriétaire
6	Vicuna-33B	1096	7.12	59.2	Non commercial
7	Vicuna-13B	1051	6.57	55.8	Communauté Llama 2
8	MPT-30B-chat	1046	6.39	50.4	CC-BY-NC-SA-4.0
9	WizardLM-13B-v1.1	1040	6.76	50	Non commercial
10	Guanaco-33B	1038	6.53	57.6	Non commercial
11	PaLM-Chat-Bison-001	1015	6.4	–	Propriétaire
12	Vicuna-7B	1006	6.17	49.8	Communauté Llama 2
13	Llama-2-13b-chat	987	6.65	53.6	Communauté Llama 2
14	Koala-13B	983	5.35	44.7	Non commercial
15	GPT4All-13B-Snoozy	967	5.41	43	x
16	Llama-2-7b-chat	961	6.27	45.8	Communauté Llama 2
17	MPT-7B-Chat	947	5.42	32	CC-BY-NC-SA-4.0
18	RWKV-4-Raven-14B	943	3.98	25.6	Apache 2.0
19	Alpaca-13B	923	4.53	48.1	Non commercial
20	OpenAssistant-Pythia-12B	915	4.32	27	Apache 2.0
21	ChatGLM-6B	900	4.5	36.1	No comercial
22	FastChat-T5-3B	892	3.04	47.7	Apache 2.0
23	StableLM-Tuned-Alpha-7B	863	2.75	24.4	CC-BY-NC-SA-4.0
24	Dolly-V2-12B	842	3.28	25.7	MIT
25	LLaMA-13B	817	2.61	47	Non commercial
26	WizardLM-30B	–	7.01	58.7	Non commercial
27	Vicuna-13B-16k	–	6.87	54.1	Communauté Llama 2
28	Llama-2-70b-chat	–	6.86	63	Communauté Llama 2
29	Tulu-30B	–	6.43	58.1	Non commercial
30	Guanaco-65B	–	6.41	62.1	Non commercial
31	OpenAssistant-LLaMA-30B	–	6.41	56	Non commercial
32	WizardLM-13B	–	6.35	52.3	Non commercial
33	Vicuna-7B-16k	–	6.22	48.5	Communauté Llama 2
34	Baize-v2-13B	–	5.75	48.9	Non commercial
35	XGen-7B-8K-Inst	–	5.55	42.1	Non commercial
36	Nous-Hermes-13B	–	5.51	49.3	Non commercial
37	MPT-30B-Instruct	–	5.22	47.8	CC-BY-SA 3.0
38	Falcon-40B-Instruct	–	5.17	54.7	Apache 2.0
39	ChatGLM2-6B	–	4.96	45.5	Apache-2.0
40	H2O-Oasst-OpenLLaMA-13B	–	4.63	42.8	Apache 2.0

Le piège de la « gratuité

Si les modèles sont gratuits, il n’est pas si simple de les mettre en œuvre et d’en tirer profit. Vous devez avoir de l’expérience dans les domaines suivants

Déployer des modèles dans le nuage.
La formation avec des données personnalisées.
Le développement d’applications spécialisées.

Cette situation est à l’origine d’un marché des services de conseil pour les modèles open source, qui présente un grand potentiel commercial.

Le futur écosystème de l’IA

Au-delà des modèles, l’ouverture s’étend à d’autres éléments clés de l’IA :

Données : mise à disposition d’ensembles de données ouvertes pour l’entraînement.
Algorithmes : cadres d’apprentissage automatique tels que TensorFlow ou PyTorch.
Chips : architectures ouvertes telles que RISC-V, qui accélèrent l’innovation matérielle.

En bref, la démocratisation de l’IA ne fait que commencer. Il reste à voir si l’ouverture finira par supplanter les acteurs dominants actuels.

DÉCOUVREZ EN PLUS SUR LE SUJET

Nouvelles

Open Source

Cet article a été écrit par Miguel Ángel G.P. et parle de Open Source et Nouvelles. Il a été publié le 3 de octobre de 2023.