Comment empêcher l’utilisation de vos données pour l’entraînement de ChatGPT et d’autres chatbots

Accueil · Blog IA · Guides et tutoriels · Comment empêcher l’utilisation de vos données pour l’entraînement de ChatGPT et d’autres chatbots
Utilisateur ajustant les paramètres de confidentialité de ChatGPT.

Pourquoi devriez-vous vous soucier de vos données ? De nos jours, la confidentialité de nos données est un sujet plus pertinent que jamais. Vous êtes-vous déjà demandé ce qu’il advient des informations que vous partagez sur Internet ? De grandes entreprises utilisent vos données pour entraîner des modèles d’intelligence artificielle comme ChatGPT. Cela signifie que vos informations pourraient faire partie d’énormes bases de données qui enseignent à ces technologies à comprendre et générer du langage. Mais est-ce vraiment ce que vous voulez ?

Il est essentiel de comprendre que vos données ne sont pas seulement utilisées pour améliorer les services, mais peuvent également être partagées avec des tiers sans votre consentement explicite. Cela pourrait conduire à des situations inconfortables, voire dangereuses, comme l’utilisation abusive d’informations personnelles ou la création de profils qui peuvent affecter vos opportunités professionnelles ou financières. Cela semble alarmant ? Ça l’est !

À mesure que de plus en plus de personnes se préoccupent de leur vie privée en ligne, le besoin de savoir comment protéger nos données devient crucial. Il ne s’agit pas seulement d’éviter l’espionnage, mais de contrôler qui accède à vos informations et à quelles fins. La bonne nouvelle est qu’il existe des moyens de refuser de partager vos données et ainsi de maintenir votre vie privée intacte.

Comment savoir si vos informations sont utilisées

Détecter si vos données sont utilisées pour entraîner des modèles d’intelligence artificielle peut sembler compliqué, mais il existe quelques signes et étapes que vous pouvez suivre pour le découvrir. Tout d’abord, consultez les politiques de confidentialité des plateformes que vous utilisez. Souvent, ces politiques détaillent comment vos données sont collectées, utilisées et partagées. Bien qu’elles soient souvent longues et techniques, chercher des mots-clés comme « entraînement de l’IA » ou « partage des données avec des tiers » peut vous aider à mieux comprendre comment vos données sont gérées.

De plus, certaines plateformes offrent des outils de transparence permettant aux utilisateurs de voir comment leurs informations sont utilisées. Par exemple, Google et Facebook ont des sections où vous pouvez examiner et contrôler l’activité de vos données. Ces outils vous montrent non seulement quelles données sont collectées, mais aussi comment elles sont utilisées pour personnaliser votre expérience ou entraîner des algorithmes.

Une autre façon de savoir si vos informations sont utilisées est de prêter attention aux communications et aux annonces personnalisées. Si vous remarquez que vous recevez des recommandations extrêmement précises ou des annonces qui semblent en savoir trop sur vous, il est probable que vos données soient traitées par des systèmes d’intelligence artificielle. Cela inclut non seulement les recherches sur Internet, mais aussi le contenu que vous consommez sur les réseaux sociaux et les services de streaming.

Enfin, n’hésitez pas à demander directement aux entreprises comment vos données sont utilisées. Souvent, envoyer un courriel ou utiliser les canaux de support peut vous fournir des réponses claires et spécifiques. Savoir comment et pourquoi vos données sont utilisées est la première étape pour prendre des décisions éclairées sur votre vie privée.

Étapes pour refuser de partager vos données

Si vous décidez que vous ne voulez pas que vos données soient utilisées pour entraîner des modèles d’intelligence artificielle, il existe plusieurs actions que vous pouvez entreprendre pour protéger votre vie privée. Voici quelques étapes pratiques :

  1. Réglez les paramètres de confidentialité : La plupart des plateformes vous permettent d’ajuster les paramètres de confidentialité pour limiter l’accès à vos données. Allez dans la section des paramètres de confidentialité et assurez-vous de désactiver toute option permettant l’utilisation de vos données pour l’entraînement de l’IA ou le partage avec des tiers.
  2. Utilisez des outils d’exclusion : Certaines entreprises offrent des outils spécifiques pour refuser de partager vos données. Par exemple, OpenAI et d’autres organisations permettent aux utilisateurs d’envoyer des demandes pour exclure leurs informations de l’entraînement de leurs modèles. Renseignez-vous pour savoir si les plateformes que vous utilisez ont des options similaires (vous trouverez ci-dessous un tableau complet avec de nombreuses plateformes et leurs outils d’exclusion) et suivez les étapes nécessaires pour compléter l’exclusion.
  3. Supprimez vos informations : Dans certains cas, vous pouvez demander la suppression complète de vos données des serveurs d’une entreprise. Cela est particulièrement utile si vous décidez de ne plus utiliser un service et souhaitez vous assurer que vos informations ne restent pas stockées.
  4. Éduquez vos amis et votre famille : Souvent, nos données sont collectées indirectement par le biais d’interactions avec d’autres personnes. Informez vos amis et votre famille de l’importance de la vie privée et encouragez-les à prendre des mesures similaires pour protéger leurs informations.
  5. Utilisez des services et applications centrés sur la vie privée : Envisagez de passer à des services qui privilégient la confidentialité et la sécurité. Par exemple, des moteurs de recherche comme DuckDuckGo ne suivent pas vos recherches, et des applications de messagerie comme Signal offrent un chiffrement de bout en bout.

Je vous laisse un tableau avec les étapes à suivre et les liens correspondants de chaque plateforme pour que vous puissiez commencer à contrôler l’utilisation de vos données. J’espère que cela vous sera utile.

EntrepriseLienInstructions
AdobeAdobe Privacy PageOuvrez la page de confidentialité d’Adobe, faites défiler jusqu’à la section d’analyse de contenu et cliquez sur l’interrupteur pour le désactiver. Pour les comptes professionnels ou scolaires, le processus d’exclusion n’est pas disponible au niveau individuel; vous devez contacter votre administrateur.
Amazon: AWSAWS Support PageLe processus d’exclusion est compliqué. Vous avez besoin de l’aide d’un professionnel de l’informatique dans votre entreprise ou d’un représentant d’AWS. Inclut l’activation de l’option pour votre organisation, la création d’une politique et l’attachement de cette politique où nécessaire.
Google: GeminiGoogle Privacy Hub for GeminiOuvrez Gemini dans votre navigateur, cliquez sur Activité et sélectionnez le menu déroulant Désactiver. Ici, vous pouvez simplement désactiver l’Activité des Apps de Gemini ou également choisir de supprimer vos données de conversation.
GrammarlyGrammarly Account SettingsPour les comptes personnels, il n’y a pas de processus d’exclusion. Pour les comptes professionnels autogérés, ouvrez les paramètres du compte, cliquez sur l’onglet Paramètres de données et désactivez l’amélioration et l’entraînement du produit. Les comptes gérés sont automatiquement exclus de l’entraînement de l’IA.
HubSpotEmail to HubSpotEnvoyez un courriel à [email protected] demandant que les données associées à votre compte soient exclues de l’utilisation pour l’entraînement de l’IA.
OpenAI: ChatGPTChatGPT SettingsConnectez-vous à ChatGPT, sélectionnez Paramètres, Contrôles de données et désactivez l’historique des chats et l’entraînement. Sur les applications mobiles, allez dans Paramètres, Contrôles de données et désactivez l’historique des chats et l’entraînement.
PerplexityPerplexity SettingsConnectez-vous à votre compte, cliquez sur votre nom de compte, faites défiler jusqu’à la section Compte et désactivez l’interrupteur de rétention des données de l’IA.
QuoraQuora Privacy SettingsVisitez la page de paramètres, cliquez sur Confidentialité et désactivez l’option « Permettre aux grands modèles de langage de s’entraîner avec votre contenu ».
SlackEmail to SlackL’administrateur doit envoyer un courriel à [email protected] avec pour objet « Demande d’exclusion du modèle global de Slack » et inclure l’URL de votre organisation.
SquarespaceSquarespace SettingsOuvrez Paramètres dans votre compte, recherchez Trackers et désactivez les trackers d’intelligence artificielle.
SubstackSubstack SettingsSur la page des paramètres, faites défiler jusqu’à la section de publication et activez l’interrupteur pour bloquer l’entraînement de l’IA.
TumblrTumblr App SettingsDans l’application Tumblr, allez dans Paramètres du compte, sélectionnez votre blog, cliquez sur l’icône de l’engrenage, sélectionnez Visibilité et activez l’option « Empêcher le partage avec des tiers ».
WordPressWordPress DashboardVisitez le tableau de bord de votre site, cliquez sur Paramètres, Général, puis sur Confidentialité, sélectionnez la case pour empêcher le partage avec des tiers.
Éviter que les IA ne suivent votre site webFichier Robots.txMettez à jour le fichier robots.txt de votre site web pour dire aux bots de l’IA de ne pas suivre les pages. Ajoutez une commande de désactivation ; si vous ne savez pas de quoi je parle, jetez un œil au code ci-dessous.

Comment empêcher les IA de suivre votre site web

Si vous avez votre propre site web, vous pouvez mettre à jour votre fichier robots.txt pour dire aux bots de l’IA de ne pas scraper les pages. La plupart des sites d’actualités n’autorisent pas leurs articles à être suivis par les bots de l’IA. Le fichier robots.txt de nombreux sites ne permet pas aux bots d’OpenAI, de Google, d’Amazon, de Facebook, d’Anthropic ou de Perplexity, entre autres.

Cette option d’exclusion n’est pas seulement pour les grands éditeurs : tout site web, grand ou petit, peut modifier son fichier robots pour exclure les trackers d’IA. Il suffit d’ajouter un commandement de désautorisation ; voici quelques exemples pratiques :

# Le dataset de Common Crawl. Source originale pour GPT et autres.
User-agent: CCBot
Disallow: /

# Exemple pour img2dataset, bien que la valeur par défaut soit *None*
User-agent: img2dataset
Disallow: / # GPTBot est le tracker web d'OpenAI User-agent: GPTBot Disallow: / # ChatGPT-User prend des actions directes au nom des utilisateurs de ChatGPT User-agent: ChatGPT-User Disallow: / # Bard et Vertex AI sont des APIs génératives de Google User-agent: Google-Extended Disallow: / # Blocages spéculatifs pour Anthropic User-agent: anthropic-ai Disallow: / User-agent: Claude-Web Disallow: / # webz.io - ils vendent des données pour entraîner des modèles de langage. User-agent: Omgilibot Disallow: / User-agent: Omgili Disallow: / # Le bot de Meta qui scrape des pages web publiques pour améliorer les modèles de langage User-agent: FacebookBot Disallow: / # Le bot de ByteDance utilisé pour collecter des données pour ses modèles de langage, y compris Doubao. User-agent: Bytespider Disallow: / # Brandwatch - "IA pour découvrir de nouvelles tendances" User-agent: magpie-crawler Disallow: /

Tomar estos pasos no solo te ayudará a mantener tus datos privados, sino que también enviará un mensaje claro a las compañías sobre la importancia de la privacidad para los usuarios.

DÉCOUVREZ EN PLUS SUR LE SUJET

Laissez le premier commentaire