Maison News > Modèles à faible coût de Deepseek AI soupçonnés d'utiliser les données OpenAI, déclenchant l'ironie en ligne

Modèles à faible coût de Deepseek AI soupçonnés d'utiliser les données OpenAI, déclenchant l'ironie en ligne

by Riley Apr 28,2025

La controverse entourant les modèles d'IA profonde de Chine s'est intensifiée, avec des soupçons qu'ils ont été développés à l'aide de données d'OpenAI. Cette semaine, l'ancien président Donald Trump a qualifié Deepseek de "réveil" pour l'industrie technologique américaine, à la suite d'une baisse significative de 600 milliards de dollars de la valeur marchande de Nvidia.

L'introduction de Deepseek a provoqué une forte baisse des actions des entreprises en profondeur dans les technologies de l'IA. Nvidia, une force dominante sur le marché GPU essentiel pour les opérations de l'IA, a connu une plongeon historique de 16,86% dans ses actions. D'autres acteurs majeurs comme Microsoft, Meta Plateformes et la société mère de Google Alphabet ont vu des baisses allant de 2,1% à 4,2%, tandis que Dell Technologies, connue pour les serveurs d'IA, a chuté de 8,7%.

Deepseek vante son modèle R1 comme une alternative rentable aux modèles d'IA occidentaux comme Chatgpt. Construit sur la profondeur open-source-v3, il exigerait moins de puissance de calcul et a été formé pour seulement 6 millions de dollars. Malgré un certain scepticisme quant à ces affirmations, l'émergence de Deepseek a contesté les investissements massifs des géants de la technologie américaine dans l'IA, des investisseurs troublants. Le modèle a rapidement grimpé au sommet des tableaux de téléchargement d'applications gratuits américains, alimentés par des discussions sur ses capacités.

Bloomberg a rapporté qu'Openai et Microsoft étudient si Deepseek a utilisé l'API d'Openai pour intégrer les modèles d'Openai dans ses propres. Openai a noté à Bloomberg: "Nous connaissons des sociétés basées à PRC (Chine) - et d'autres - essaient constamment de distiller les modèles de dirigeants de sociétés américaines américaines." La distillation, une méthode utilisée pour former l'IA en extrait les données de modèles plus avancés, viole les conditions d'utilisation d'OpenAI.

Openai a souligné son engagement à protéger sa propriété intellectuelle et à collaborer avec le gouvernement américain pour protéger ses modèles avancés des concurrents et des adversaires. David Sacks, le tsar de l'IA de Trump, a déclaré à Fox News: "Il y a des preuves substantielles que ce que Deepseek a fait ici, c'est qu'ils ont distillé des connaissances des modèles Openai, et je ne pense pas que Openai en est très content."

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov / Bloomberg via Getty Images.
Au milieu de ces développements, il y a eu une critique pointue de la position d'Openai. Tech PR et l'écrivain Ed Zitron ont souligné l'ironie, notant: "Openai, la société construite sur le vol littéralement de l'ensemble de l'Internet, pleure parce que Deepseek a peut-être formé les sorties de Chatgpt."

En janvier 2024, Openai a fait valoir dans une soumission au comité du Royaume-Uni à la Chambre des communications et du numérique du Royaume-Uni qu'il était "impossible" de développer des outils d'IA comme Chatgpt sans utiliser de matériel protégé par le droit d'auteur. Ils ont souligné que le droit d'auteur couvre pratiquement toutes les formes d'expression humaine, ce qui rend essentiel pour la formation de modèles d'IA pour répondre aux besoins modernes.

Le débat sur l'utilisation du matériel protégé par le droit d'auteur pour former l'IA est devenu plus chaud à mesure que les technologies d'IA génératrices ont augmenté. En décembre 2023, le New York Times a déposé une plainte contre Openai et Microsoft pour "l'utilisation illégale" de son contenu. Openai a répondu en défendant la pratique comme «utilisation équitable» et en rejetant le procès comme sans mérite.

Cette bataille juridique a suivi un procès de septembre 2023 par 17 auteurs, dont George RR Martin, alléguant "un vol systématique à l'échelle de masse". De plus, en août de la même année, le juge de district Beryl Howell a soutenu la position du bureau du droit d'auteur américain selon laquelle l'art généré par l'AI ne peut pas être protégé par le droit d'auteur, réaffirmant la nécessité de la créativité humaine pour la protection des droits d'auteur.