Top Promos Apple

iPhone 16

Tests Apple

Antivirus Mac

VPN Mac

Chargeur iPhone

Nettoyeur Mac

Comparatif iPhone

Dock Thunderbolt

Actualité

Divers

Apple et d'autres ont utilisé des données siphonnées sur YouTube pour entrainer leurs IA

Par June Cantillon - Publié le

De grands acteurs de la tech se sont appuyés sur des fichiers comprenant des données siphonnées sur des chaînes YouTube pour entrainer leurs intelligences artificielles..

IA YouTube Apple entrainement


Apple et d'autres ont entrainé leurs IA sur des données de Youtube



Pour que les algorithmes d'intelligence artificielle soient performants, il faut les entrainer en les nourrissant avec d'énormes bases de données. Selon nos confrères de Proof News et Wired, certaines firmes dont Apple, Anthropic, Nvidia et Salesforce ont utilisé une base de données s'appuyant sur des sous-titres tirés de vidéos YouTube, alors que Google (qui n'est certainement pas la dernière à chercher à nourrir ses IA de données plus ou moins légalement) précise bien qu'elle ne permet pas cet usage.



Plus de 170 000 vidéos siphonnées



La base de données contient les sous-titres de plus de 170 000 vidéos provenant de 48 000 chaînes, dont certaines très connues, comme celles de MrBeast, PewDiePie, Marques Bronwlee (MKBHD), The Verge, ABC News, la BBC, The New York Times, Stephen Colbert, John Oliver, ou encore Jimmy Kimmel. Cette base de données a été collectée, sans en avoir le droit, puis proposée aux différents acteurs du marché de l'intelligence artificielle par la firme à but non lucratif EleutherAI. Ces sous-titres ainsi que d'autres données sont regroupés sous le nom The Pile et servent ensuite à entrainer les différentes IA.

Appel aurait ainsi mis à profit la base de données The Pile pour entrainer OpenELM (pour Open-source Efficient Language Models). Il s'agit d'une série de 4 grands modèles de langages avec respectivement 270 millions, 450 millions, 1 milliard et 3 millards de paramètres. Ces caractéristiques relativement réduites pour des grands modèles de langage ont pour particularité de permettre un traitement en local, et pas uniquement via des serveurs dans le cloud. Ce sont donc, en partie, sur ces travaux que s'appuiera le futur bouquet d'outils d'Apple Intelligence pour le traitement des requêtes sur les iPhone, iPad et Mac.

Même si Apple et les autres grandes sociétés peuvent mettre en avant que les données n'ont pas été récoltées par leur soin, et qu'ils ont donc agi en toute bonne foi (ou tout du moins le prétendre), cet exemple souligne tout de même parfaitement le souci des sources utilisées pour entrainer les IA. Lorsque ces intelligences artificielles sont suffisamment entrainées, elles sont la plupart du temps utilisées pour générer des profits, sans que les auteurs des données utilisées pour les perfectionner ne soient rémunérés.
Mac4Ever recrute sur Paris et Nîmes

Mac4Ever recrute sur Paris et Nîmes

Mac4ever renforce ses équipes et recherche plusieurs personnes pour participer à la rédaction de son fil d'actualité, à la création de contenu vidéo, ainsi qu'à l'amélioration du référencement des contenus. Si tu es intéressé, n'hésite pas à postuler !

Le PDG franco-russe de Telegram a été arrêté en France

Le PDG franco-russe de Telegram a été arrêté en France

Le nom de Pavel Durov ne vous dit peut-être rien, mais ce milliardaire franco-russe et PDG de Telegram vient d'être arrêté par les...

Midjourney lance son site internet pour créer des images !

Midjourney lance son site internet pour créer des images !

Midjourney vient de lancer un site web permettant à tous les internautes de générer des images, et ce, sans passer par Discord. Dans la...

De quoi est capable le dernier robot humanoïde de Boston Dynamics ?

De quoi est capable le dernier robot humanoïde de Boston Dynamics ?

Boston Dynamics -ce spécialiste de la robotique à usage militaire- ne perd pas une occasion de s'illustrer dans son domaine de...

Siri compatible avec la bague connectée d'Apple

Siri compatible avec la bague connectée d'Apple

Ces derniers temps, les bagues connectées connaissent un franc succès, comme on peut le voir chez Oura Ring, Samsung ou encore AmazFit. Pour...

Une deuxième implantation réussie pour Neuralink

Une deuxième implantation réussie pour Neuralink

Le projet Neuralink d'Elon Musk -dont l'activité est de fabriquer et commercialiser des puces cérébrales- vient de passer une nouvelle...

L'Apple Car pour enfant est enfin réalité ! (photos)

L'Apple Car pour enfant est enfin réalité ! (photos)

Alors que beaucoup rêvent encore d'une Apple Car, l'ébéniste vietnamien Trương Văn Đạo, alias @ndwoodart, a enfin réalisé son...

Apple étend le délai pour renouveler un plan AppleCare+

Apple étend le délai pour renouveler un plan AppleCare+

Parmi les bonnes nouvelles en prévision de la rentrée, Apple vient d'augmenter la période de temps pendant laquelle les clients peuvent...

Bouygues Telecom autorisée à racheter La Poste Mobile

Bouygues Telecom autorisée à racheter La Poste Mobile

Après plus de cinq mois depuis le début des négociations, Bouygues Telecom vient enfin d'être autorisé par l'Autorité...

Commentaires

Connectez-vous/créez un compte pour réagir à cet article !
Oops, vous n'êtes pas connecté

Pour évaluer un commentaire sur Mac4Ever, vous devez être connecté avec votre compte utilisateur.

9 commentaires
Connectez-vous/créez un compte pour réagir à cet article !
Oops, vous n'êtes pas connecté

Pour évaluer un commentaire sur Mac4Ever, vous devez être connecté avec votre compte utilisateur.