Imaginez un monde oĂč les intelligences artificielles peuvent naviguer sur le web avec la mĂȘme facilitĂ© que nous. Cela pourrait devenir une rĂ©alitĂ© grĂące Ă une nouvelle norme appelĂ©e llms.txt, proposĂ©e par le vĂ©tĂ©ran de l’IA Jeremy Howard. Cette norme est conçue pour aider les systĂšmes d’IA Ă trouver et Ă traiter l’information de maniĂšre plus efficace.
Pourquoi est-ce pertinent ? La plupart des pages web actuelles sont conçues pour les humains, ce qui peut rendre la tĂąche des modĂšles de langage difficile, car ils ont souvent des problĂšmes pour gĂ©rer de grands volumes de texte. Le llms.txt se prĂ©sente comme une solution Ă cette difficultĂ©, permettant aux modĂšles d’accĂ©der Ă du contenu de maniĂšre plus ciblĂ©e et conviviale.
Rendre le web plus accessible pour les LLM
Le format du llms.txt est simple et efficace. Chaque fichier commence par le nom du projet et un bref rĂ©sumĂ©, suivi de dĂ©tails supplĂ©mentaires et de liens vers d’autres documents au format Markdown.
Cette structure est pensĂ©e pour amĂ©liorer la lecture et la comprĂ©hension des sites web par les systĂšmes d’IA.
De plus, Howard suggĂšre que les propriĂ©taires de sites web offrent des versions Markdown de leurs pages HTML, en ajoutant simplement .md Ă leurs URLs. Des projets comme FastHTML mettent dĂ©jĂ en Ćuvre cette approche en gĂ©nĂ©rant automatiquement des versions Markdown de leurs documents.
Cette initiative pourrait ĂȘtre particuliĂšrement bĂ©nĂ©fique pour les dĂ©veloppeurs et les bibliothĂšques de code, car elle faciliterait la comprĂ©hension par les IA des informations structurĂ©es. L’entreprise d’IA Anthropic a Ă©galement tĂ©lĂ©chargĂ© son propre llms.txt pour sa documentation, soulignant l’importance de cette norme.
Collaboration avec les normes web existantes
Le llms.txt n’arrive pas pour remplacer, mais pour coexister avec des outils web dĂ©jĂ connus, comme robots.txt et sitemap.xml. Alors que ces normes aident les moteurs de recherche Ă explorer les pages, le llms.txt se concentre sur l’aide aux IA pour identifier et comprendre le contenu le plus pertinent d’un site, y compris des liens vers des ressources supplĂ©mentaires.
La clé du succÚs de cette nouvelle norme réside dans son adoption par les développeurs web. Si suffisamment de sites commencent à utiliser llms.txt, nous pourrions assister à un changement radical dans la façon dont les IA lisent et comprennent le contenu en ligne.
Cependant, des questions essentielles se posent Ă©galement sur l’avenir du web. Qui est responsable lorsque une IA réécrit le contenu d’un site ? Comment le droit d’auteur des propriĂ©taires est-il protĂ©gĂ© ? Ces interrogations attendent encore des rĂ©ponses claires de la part des laboratoires d’IA.








