Microsoft a apparemment ouvert une enquête sur la startup d’intelligence artificielle chinoise Deepseek, après que le sponsor OpenAI a allégué que cette dernière aurait utilisé ChatGPT pour développer son modèle concurrent, le R-1.
Cette enquête fait suite à des avertissements émis par les chercheurs de Microsoft, l’un des principaux investisseurs d’OpenAI, concernant un groupe d’utilisateurs lié à Deepseek, qui aurait extrait d’importantes quantités de données via l’API d’OpenAI, selon un rapport du Financial Times.
Détection d’anomalies par les chercheurs de Microsoft sur l’API OpenAI
À l’automne 2024, les chercheurs de Microsoft Security ont identifié d’importantes récoltes de données non autorisées utilisant l’API d’OpenAI. Après cette découverte, Microsoft a immédiatement informé OpenAI de ces activités suspectes, considérées comme une tentative de grattage de données illegitime et une violation des conditions d’utilisation d’OpenAI.
Deepseek, la startup d’IA chinoise, a présenté son modèle R-1 plus tôt cette semaine, modèle qui est au centre du conflit entre Microsoft et OpenAI. Cela survient après que la demande pour de nouveaux modèles d’IA a explosé en ligne en raison de leurs vitesses de performance et de leur coût relativement bas par rapport à ceux d’OpenAI, surpassant également plusieurs modèles de sociétés américaines comme Meta et X dans divers benchmarks.
Deepseek a révélé que la formation et la gestion de son nouveau modèle n’a coûté que quelques millions de dollars, grâce à l’utilisation de puces moins chères. Cette annonce a provoqué des ondes de choc sur le marché américain, notamment chez Nvidia, leader de la production de puces d’IA, dont la capitalisation boursière a chuté face à des craintes croissantes que l’entreprise chinoise puisse remettre en question la suprématie des entreprises américaines dans le domaine de l’IA.
Deepseek a-t-il formé son IA en utilisant des modèles d’OpenAI ?
Selon David Sacks, président de la crypto et tsar de l’IA sous Donald Trump, il existerait des preuves convaincantes que Deepseek a utilisé les résultats des modèles d’OpenAI pour entraîner sa propre IA. Ce processus technique est désigné par le terme de distillation, où un modèle imite les capacités d’un autre en apprenant à partir de ses sorties.
Sacks a déclaré : “Il existe des preuves substantielles que Deepseek a distillé des connaissances à partir des modèles d’OpenAI, et je ne pense pas qu’OpenAI en soit très heureux.”
OpenAI a mentionné que des entreprises d’IA en Chine et ailleurs tentent constamment d’extraire des informations des modèles développés aux États-Unis, sans accuser directement Deepseek.
Un porte-parole d’OpenAI a déclaré à Bloomberg : « Nous sommes conscients que les sociétés basées en RPC – ainsi que d’autres – s’efforcent continuellement de distiller les modèles des entreprises d’IA américaines ».
Alors que Microsoft enquête sur les produits de Deepseek, des responsables américains prennent également des mesures pour limiter les préoccupations.
Le 24 janvier, la Marine américaine a publié une directive interdisant à son personnel d’interagir avec Deepseek de quelque manière que ce soit. CNBC a rapporté que cette interdiction est due aux craintes que le gouvernement chinois pourrait utiliser le modèle d’IA pour accéder à des données sensibles.
Cryptopolitan Academy : faites-vous ces erreurs sur votre curriculum vitae web3 ? – Découvrez ici
Source : https://www.cryptopolitan.com/microsoft-investigating-deepseek-openai-data/
Résumé :
Microsoft enquête sur la startup chinoise Deepseek, soupçonnée d’utiliser des données d’OpenAI pour développer son modèle R-1. Cette enquête fait suite à des alertes concernant l’extraction illégale de données via l’API d’OpenAI. Deepseek a récemment lancé un modèle d’IA performant et abordable, provoquant des inquiétudes sur la concurrence avec des entreprises américaines. Des allégations suggèrent que Deepseek a distillé des connaissances des modèles d’OpenAI pour son propre entraînement. Pendant ce temps, la Marine américaine a interdit à son personnel d’interagir avec Deepseek en raison de craintes liées à la sécurité des données.