L’intelligence artificielle générative vit une période fascinante. Avec le lancement récent de modèles d’IA open source tels que LLaMA 2 et ChatGLM, une nouvelle tendance à l’ouverture et à la démocratisation du domaine se dessine.
Le règne d’OpenAI et de ses alliés
Jusqu’à présent, OpenAI dominait nettement le marché des grands modèles linguistiques avec le GPT-3 et le récent GPT-4, considérés comme les plus avancés. Ses modèles sont fermés et OpenAI décide qui peut y accéder.
Mais même ses partenaires les plus proches, tels que Microsoft et Meta, adoptent désormais le mouvement open source, remettant en cause la domination d’OpenAI avec des alternatives telles que LLaMA 2.
La vague des modèles ouverts
Ces dernières semaines, de nombreuses annonces de nouveaux grands modèles d’IA open source ont été faites :
- Meta a publié LLaMA 2, en partenariat avec Microsoft.
- Alibaba Cloud a publié des modèles ouverts tels que Qwen-7B.
- Baidu a ajouté 30 modèles open source à sa plateforme Wenxin Qianfan.
Pourquoi cette tendance à l’open source ?
Plusieurs raisons expliquent ce mouvement :
Encourager l’innovation
En publiant les modèles, davantage de développeurs peuvent expérimenter, créer de nouvelles applications et améliorer la technologie. C’est un peu comme Android par rapport à iOS.
Démontrer les capacités
L’ouverture du code permet de valider la qualité des modèles. Les entreprises veulent montrer qu’elles peuvent rivaliser avec OpenAI.
Agilité
Les modèles open source sont plus rapides à mettre à jour. Les développeurs préfèrent leur flexibilité.
Création d’écosystèmes
Un large écosystème autour de LLaMA 2 et d’autres modèles ouverts contribue à leur adoption rapide.
Grands modèles de langage (LLM) classés par capacité
Ce tableau présente un classement des meilleurs modèles d’IA conversationnelle par capacité.
Ces modèles d’IA sont formés pour être capables de tenir des conversations cohérentes et fluides comme s’ils étaient humains. Plus ils sont grands et avancés, plus ils sont intelligents et capables de tenir une conversation.
Le tableau présente des modèles bien connus, tels que GPT-4 d’OpenAI ou Claude d’Anthropic, ainsi que des modèles moins populaires.
Plusieurs mesures sont indiquées pour évaluer la capacité de chaque modèle :
- Arena Elo Score : mesure la qualité de la conversation, telle qu’elle est jugée par des milliers d’utilisateurs réels. Plus le score est élevé, meilleur est le modèle conversationnel.
- MT-bench score : évalue la capacité du modèle à répondre à des questions complexes à plusieurs tours.
- MMLU : mesure la précision du modèle sur 57 tâches linguistiques différentes.
Il indique également si le modèle est open source ou propriétaire, c’est-à-dire si sa technologie est librement partagée ou si elle est détenue par une entreprise.
Le tableau vous permet de comparer les compétences conversationnelles et les performances des modèles d’IA les plus populaires afin de déterminer lesquels sont actuellement les plus puissants. Les modèles open source cherchent à démocratiser l’IA en la partageant librement.
Position | Modèle | Score Arena Elo | Score MT-bench | MMLU | Licence |
---|---|---|---|---|---|
1 | GPT-4 | 1206 | 8.99 | 86.4 | Propriétaire |
2 | Claude-1 | 1166 | 7.9 | 77 | Propriétaire |
3 | Claude-instant-1 | 1138 | 7.85 | 73.4 | Propriétaire |
4 | Claude-2 | 1135 | 8.06 | 78.5 | Propriétaire |
5 | GPT-3.5-turbo | 1122 | 7.94 | 70 | Propriétaire |
6 | Vicuna-33B | 1096 | 7.12 | 59.2 | Non commercial |
7 | Vicuna-13B | 1051 | 6.57 | 55.8 | Communauté Llama 2 |
8 | MPT-30B-chat | 1046 | 6.39 | 50.4 | CC-BY-NC-SA-4.0 |
9 | WizardLM-13B-v1.1 | 1040 | 6.76 | 50 | Non commercial |
10 | Guanaco-33B | 1038 | 6.53 | 57.6 | Non commercial |
11 | PaLM-Chat-Bison-001 | 1015 | 6.4 | – | Propriétaire |
12 | Vicuna-7B | 1006 | 6.17 | 49.8 | Communauté Llama 2 |
13 | Llama-2-13b-chat | 987 | 6.65 | 53.6 | Communauté Llama 2 |
14 | Koala-13B | 983 | 5.35 | 44.7 | Non commercial |
15 | GPT4All-13B-Snoozy | 967 | 5.41 | 43 | x |
16 | Llama-2-7b-chat | 961 | 6.27 | 45.8 | Communauté Llama 2 |
17 | MPT-7B-Chat | 947 | 5.42 | 32 | CC-BY-NC-SA-4.0 |
18 | RWKV-4-Raven-14B | 943 | 3.98 | 25.6 | Apache 2.0 |
19 | Alpaca-13B | 923 | 4.53 | 48.1 | Non commercial |
20 | OpenAssistant-Pythia-12B | 915 | 4.32 | 27 | Apache 2.0 |
21 | ChatGLM-6B | 900 | 4.5 | 36.1 | No comercial |
22 | FastChat-T5-3B | 892 | 3.04 | 47.7 | Apache 2.0 |
23 | StableLM-Tuned-Alpha-7B | 863 | 2.75 | 24.4 | CC-BY-NC-SA-4.0 |
24 | Dolly-V2-12B | 842 | 3.28 | 25.7 | MIT |
25 | LLaMA-13B | 817 | 2.61 | 47 | Non commercial |
26 | WizardLM-30B | – | 7.01 | 58.7 | Non commercial |
27 | Vicuna-13B-16k | – | 6.87 | 54.1 | Communauté Llama 2 |
28 | Llama-2-70b-chat | – | 6.86 | 63 | Communauté Llama 2 |
29 | Tulu-30B | – | 6.43 | 58.1 | Non commercial |
30 | Guanaco-65B | – | 6.41 | 62.1 | Non commercial |
31 | OpenAssistant-LLaMA-30B | – | 6.41 | 56 | Non commercial |
32 | WizardLM-13B | – | 6.35 | 52.3 | Non commercial |
33 | Vicuna-7B-16k | – | 6.22 | 48.5 | Communauté Llama 2 |
34 | Baize-v2-13B | – | 5.75 | 48.9 | Non commercial |
35 | XGen-7B-8K-Inst | – | 5.55 | 42.1 | Non commercial |
36 | Nous-Hermes-13B | – | 5.51 | 49.3 | Non commercial |
37 | MPT-30B-Instruct | – | 5.22 | 47.8 | CC-BY-SA 3.0 |
38 | Falcon-40B-Instruct | – | 5.17 | 54.7 | Apache 2.0 |
39 | ChatGLM2-6B | – | 4.96 | 45.5 | Apache-2.0 |
40 | H2O-Oasst-OpenLLaMA-13B | – | 4.63 | 42.8 | Apache 2.0 |
Le piège de la « gratuité
Si les modèles sont gratuits, il n’est pas si simple de les mettre en œuvre et d’en tirer profit. Vous devez avoir de l’expérience dans les domaines suivants
- Déployer des modèles dans le nuage.
- La formation avec des données personnalisées.
- Le développement d’applications spécialisées.
Cette situation est à l’origine d’un marché des services de conseil pour les modèles open source, qui présente un grand potentiel commercial.
Le futur écosystème de l’IA
Au-delà des modèles, l’ouverture s’étend à d’autres éléments clés de l’IA :
- Données : mise à disposition d’ensembles de données ouvertes pour l’entraînement.
- Algorithmes : cadres d’apprentissage automatique tels que TensorFlow ou PyTorch.
- Chips : architectures ouvertes telles que RISC-V, qui accélèrent l’innovation matérielle.
En bref, la démocratisation de l’IA ne fait que commencer. Il reste à voir si l’ouverture finira par supplanter les acteurs dominants actuels.