Une nouvelle vague de modèles d’IA ouverts remet en cause la domination de l’OpenAI

Accueil · Blog IA · Nouvelles · Une nouvelle vague de modèles d’IA ouverts remet en cause la domination de l’OpenAI

L’intelligence artificielle générative vit une période fascinante. Avec le lancement récent de modèles d’IA open source tels que LLaMA 2 et ChatGLM, une nouvelle tendance à l’ouverture et à la démocratisation du domaine se dessine.

Le règne d’OpenAI et de ses alliés

Jusqu’à présent, OpenAI dominait nettement le marché des grands modèles linguistiques avec le GPT-3 et le récent GPT-4, considérés comme les plus avancés. Ses modèles sont fermés et OpenAI décide qui peut y accéder.

Mais même ses partenaires les plus proches, tels que Microsoft et Meta, adoptent désormais le mouvement open source, remettant en cause la domination d’OpenAI avec des alternatives telles que LLaMA 2.

La vague des modèles ouverts

Ces dernières semaines, de nombreuses annonces de nouveaux grands modèles d’IA open source ont été faites :

  • Meta a publié LLaMA 2, en partenariat avec Microsoft.
  • Alibaba Cloud a publié des modèles ouverts tels que Qwen-7B.
  • Baidu a ajouté 30 modèles open source à sa plateforme Wenxin Qianfan.

Pourquoi cette tendance à l’open source ?

Plusieurs raisons expliquent ce mouvement :

Encourager l’innovation

En publiant les modèles, davantage de développeurs peuvent expérimenter, créer de nouvelles applications et améliorer la technologie. C’est un peu comme Android par rapport à iOS.

Démontrer les capacités

L’ouverture du code permet de valider la qualité des modèles. Les entreprises veulent montrer qu’elles peuvent rivaliser avec OpenAI.

Agilité

Les modèles open source sont plus rapides à mettre à jour. Les développeurs préfèrent leur flexibilité.

Création d’écosystèmes

Un large écosystème autour de LLaMA 2 et d’autres modèles ouverts contribue à leur adoption rapide.

Grands modèles de langage (LLM) classés par capacité

Ce tableau présente un classement des meilleurs modèles d’IA conversationnelle par capacité.

Ces modèles d’IA sont formés pour être capables de tenir des conversations cohérentes et fluides comme s’ils étaient humains. Plus ils sont grands et avancés, plus ils sont intelligents et capables de tenir une conversation.

Le tableau présente des modèles bien connus, tels que GPT-4 d’OpenAI ou Claude d’Anthropic, ainsi que des modèles moins populaires.

Plusieurs mesures sont indiquées pour évaluer la capacité de chaque modèle :

  • Arena Elo Score : mesure la qualité de la conversation, telle qu’elle est jugée par des milliers d’utilisateurs réels. Plus le score est élevé, meilleur est le modèle conversationnel.
  • MT-bench score : évalue la capacité du modèle à répondre à des questions complexes à plusieurs tours.
  • MMLU : mesure la précision du modèle sur 57 tâches linguistiques différentes.

Il indique également si le modèle est open source ou propriétaire, c’est-à-dire si sa technologie est librement partagée ou si elle est détenue par une entreprise.

Le tableau vous permet de comparer les compétences conversationnelles et les performances des modèles d’IA les plus populaires afin de déterminer lesquels sont actuellement les plus puissants. Les modèles open source cherchent à démocratiser l’IA en la partageant librement.

PositionModèleScore Arena EloScore MT-benchMMLULicence
1GPT-412068.9986.4Propriétaire
2Claude-111667.977Propriétaire
3Claude-instant-111387.8573.4Propriétaire
4Claude-211358.0678.5Propriétaire
5GPT-3.5-turbo11227.9470Propriétaire
6Vicuna-33B10967.1259.2Non commercial
7Vicuna-13B10516.5755.8Communauté Llama 2
8MPT-30B-chat10466.3950.4CC-BY-NC-SA-4.0
9WizardLM-13B-v1.110406.7650Non commercial
10Guanaco-33B10386.5357.6Non commercial
11PaLM-Chat-Bison-00110156.4Propriétaire
12Vicuna-7B10066.1749.8Communauté Llama 2
13Llama-2-13b-chat9876.6553.6Communauté Llama 2
14Koala-13B9835.3544.7Non commercial
15GPT4All-13B-Snoozy9675.4143x
16Llama-2-7b-chat9616.2745.8Communauté Llama 2
17MPT-7B-Chat9475.4232CC-BY-NC-SA-4.0
18RWKV-4-Raven-14B9433.9825.6Apache 2.0
19Alpaca-13B9234.5348.1Non commercial
20OpenAssistant-Pythia-12B9154.3227Apache 2.0
21ChatGLM-6B9004.536.1No comercial
22FastChat-T5-3B8923.0447.7Apache 2.0
23StableLM-Tuned-Alpha-7B8632.7524.4CC-BY-NC-SA-4.0
24Dolly-V2-12B8423.2825.7MIT
25LLaMA-13B8172.6147Non commercial
26WizardLM-30B7.0158.7Non commercial
27Vicuna-13B-16k6.8754.1Communauté Llama 2
28Llama-2-70b-chat6.8663Communauté Llama 2
29Tulu-30B6.4358.1Non commercial
30Guanaco-65B6.4162.1Non commercial
31OpenAssistant-LLaMA-30B6.4156Non commercial
32WizardLM-13B6.3552.3Non commercial
33Vicuna-7B-16k6.2248.5Communauté Llama 2
34Baize-v2-13B5.7548.9Non commercial
35XGen-7B-8K-Inst5.5542.1Non commercial
36Nous-Hermes-13B5.5149.3Non commercial
37MPT-30B-Instruct5.2247.8CC-BY-SA 3.0
38Falcon-40B-Instruct5.1754.7Apache 2.0
39ChatGLM2-6B4.9645.5Apache-2.0
40H2O-Oasst-OpenLLaMA-13B4.6342.8Apache 2.0

 Le piège de la « gratuité

Si les modèles sont gratuits, il n’est pas si simple de les mettre en œuvre et d’en tirer profit. Vous devez avoir de l’expérience dans les domaines suivants

  • Déployer des modèles dans le nuage.
  • La formation avec des données personnalisées.
  • Le développement d’applications spécialisées.

Cette situation est à l’origine d’un marché des services de conseil pour les modèles open source, qui présente un grand potentiel commercial.

Le futur écosystème de l’IA

Au-delà des modèles, l’ouverture s’étend à d’autres éléments clés de l’IA :

  • Données : mise à disposition d’ensembles de données ouvertes pour l’entraînement.
  • Algorithmes : cadres d’apprentissage automatique tels que TensorFlow ou PyTorch.
  • Chips : architectures ouvertes telles que RISC-V, qui accélèrent l’innovation matérielle.

En bref, la démocratisation de l’IA ne fait que commencer. Il reste à voir si l’ouverture finira par supplanter les acteurs dominants actuels.

DÉCOUVREZ EN PLUS SUR LE SUJET

Laissez le premier commentaire