Une nouvelle vague de mod√®les d’IA ouverts remet en cause la domination de l’OpenAI

Accueil ¬∑ Blog IA ¬∑ Nouvelles ¬∑ Une nouvelle vague de mod√®les d’IA ouverts remet en cause la domination de l’OpenAI

L’intelligence artificielle g√©n√©rative vit une p√©riode fascinante. Avec le lancement r√©cent de mod√®les d’IA open source tels que LLaMA 2 et ChatGLM, une nouvelle tendance √† l’ouverture et √† la d√©mocratisation du domaine se dessine.

Le r√®gne d’OpenAI et de ses alli√©s

Jusqu’√† pr√©sent, OpenAI dominait nettement le march√© des grands mod√®les linguistiques avec le GPT-3 et le r√©cent GPT-4, consid√©r√©s comme les plus avanc√©s. Ses mod√®les sont ferm√©s et OpenAI d√©cide qui peut y acc√©der.

Mais m√™me ses partenaires les plus proches, tels que Microsoft et Meta, adoptent d√©sormais le mouvement open source, remettant en cause la domination d’OpenAI avec des alternatives telles que LLaMA 2.

La vague des modèles ouverts

Ces derni√®res semaines, de nombreuses annonces de nouveaux grands mod√®les d’IA open source ont √©t√© faites :

  • Meta a publi√© LLaMA 2, en partenariat avec Microsoft.
  • Alibaba Cloud a publi√© des mod√®les ouverts tels que Qwen-7B.
  • Baidu a ajout√© 30 mod√®les open source √† sa plateforme Wenxin Qianfan.

Pourquoi cette tendance √† l’open source ?

Plusieurs raisons expliquent ce mouvement :

Encourager l’innovation

En publiant les mod√®les, davantage de d√©veloppeurs peuvent exp√©rimenter, cr√©er de nouvelles applications et am√©liorer la technologie. C’est un peu comme Android par rapport √† iOS.

Démontrer les capacités

L’ouverture du code permet de valider la qualit√© des mod√®les. Les entreprises veulent montrer qu’elles peuvent rivaliser avec OpenAI.

Agilité

Les modèles open source sont plus rapides à mettre à jour. Les développeurs préfèrent leur flexibilité.

Cr√©ation d’√©cosyst√®mes

Un large √©cosyst√®me autour de LLaMA 2 et d’autres mod√®les ouverts contribue √† leur adoption rapide.

Grands modèles de langage (LLM) classés par capacité

Ce tableau pr√©sente un classement des meilleurs mod√®les d’IA conversationnelle par capacit√©.

Ces mod√®les d’IA sont form√©s pour √™tre capables de tenir des conversations coh√©rentes et fluides comme s’ils √©taient humains. Plus ils sont grands et avanc√©s, plus ils sont intelligents et capables de tenir une conversation.

Le tableau pr√©sente des mod√®les bien connus, tels que GPT-4 d’OpenAI ou Claude d’Anthropic, ainsi que des mod√®les moins populaires.

Plusieurs mesures sont indiquées pour évaluer la capacité de chaque modèle :

  • Arena Elo Score : mesure la qualit√© de la conversation, telle qu’elle est jug√©e par des milliers d’utilisateurs r√©els. Plus le score est √©lev√©, meilleur est le mod√®le conversationnel.
  • MT-bench score : √©value la capacit√© du mod√®le √† r√©pondre √† des questions complexes √† plusieurs tours.
  • MMLU : mesure la pr√©cision du mod√®le sur 57 t√Ęches linguistiques diff√©rentes.

Il indique √©galement si le mod√®le est open source ou propri√©taire, c’est-√†-dire si sa technologie est librement partag√©e ou si elle est d√©tenue par une entreprise.

Le tableau vous permet de comparer les comp√©tences conversationnelles et les performances des mod√®les d’IA les plus populaires afin de d√©terminer lesquels sont actuellement les plus puissants. Les mod√®les open source cherchent √† d√©mocratiser l’IA en la partageant librement.

PositionModèleScore Arena EloScore MT-benchMMLULicence
1GPT-412068.9986.4Propriétaire
2Claude-111667.977Propriétaire
3Claude-instant-111387.8573.4Propriétaire
4Claude-211358.0678.5Propriétaire
5GPT-3.5-turbo11227.9470Propriétaire
6Vicuna-33B10967.1259.2Non commercial
7Vicuna-13B10516.5755.8Communauté Llama 2
8MPT-30B-chat10466.3950.4CC-BY-NC-SA-4.0
9WizardLM-13B-v1.110406.7650Non commercial
10Guanaco-33B10386.5357.6Non commercial
11PaLM-Chat-Bison-00110156.4Propriétaire
12Vicuna-7B10066.1749.8Communauté Llama 2
13Llama-2-13b-chat9876.6553.6Communauté Llama 2
14Koala-13B9835.3544.7Non commercial
15GPT4All-13B-Snoozy9675.4143x
16Llama-2-7b-chat9616.2745.8Communauté Llama 2
17MPT-7B-Chat9475.4232CC-BY-NC-SA-4.0
18RWKV-4-Raven-14B9433.9825.6Apache 2.0
19Alpaca-13B9234.5348.1Non commercial
20OpenAssistant-Pythia-12B9154.3227Apache 2.0
21ChatGLM-6B9004.536.1No comercial
22FastChat-T5-3B8923.0447.7Apache 2.0
23StableLM-Tuned-Alpha-7B8632.7524.4CC-BY-NC-SA-4.0
24Dolly-V2-12B8423.2825.7MIT
25LLaMA-13B8172.6147Non commercial
26WizardLM-30B7.0158.7Non commercial
27Vicuna-13B-16k6.8754.1Communauté Llama 2
28Llama-2-70b-chat6.8663Communauté Llama 2
29Tulu-30B6.4358.1Non commercial
30Guanaco-65B6.4162.1Non commercial
31OpenAssistant-LLaMA-30B6.4156Non commercial
32WizardLM-13B6.3552.3Non commercial
33Vicuna-7B-16k6.2248.5Communauté Llama 2
34Baize-v2-13B5.7548.9Non commercial
35XGen-7B-8K-Inst5.5542.1Non commercial
36Nous-Hermes-13B5.5149.3Non commercial
37MPT-30B-Instruct5.2247.8CC-BY-SA 3.0
38Falcon-40B-Instruct5.1754.7Apache 2.0
39ChatGLM2-6B4.9645.5Apache-2.0
40H2O-Oasst-OpenLLaMA-13B4.6342.8Apache 2.0

¬†Le pi√®ge de la ¬ę¬†gratuit√©

Si les mod√®les sont gratuits, il n’est pas si simple de les mettre en Ňďuvre et d’en tirer profit. Vous devez avoir de l’exp√©rience dans les domaines suivants

  • D√©ployer des mod√®les dans le nuage.
  • La formation avec des donn√©es personnalis√©es.
  • Le d√©veloppement d’applications sp√©cialis√©es.

Cette situation est √† l’origine d’un march√© des services de conseil pour les mod√®les open source, qui pr√©sente un grand potentiel commercial.

Le futur √©cosyst√®me de l’IA

Au-del√† des mod√®les, l’ouverture s’√©tend √† d’autres √©l√©ments cl√©s de l’IA :

  • Donn√©es : mise √† disposition d’ensembles de donn√©es ouvertes pour l’entra√ģnement.
  • Algorithmes : cadres d’apprentissage automatique tels que TensorFlow ou PyTorch.
  • Chips : architectures ouvertes telles que RISC-V, qui acc√©l√®rent l’innovation mat√©rielle.

En bref, la d√©mocratisation de l’IA ne fait que commencer. Il reste √† voir si l’ouverture finira par supplanter les acteurs dominants actuels.

D√ČCOUVREZ EN PLUS SUR LE SUJET

Laissez le premier commentaire