Aller au contenu

« DeepSeek » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Nouvelle page : {| class="infobox" style="float: right; width: 25em; text-align: left; font-size: 90%; margin-left: 1em;" |+ style="font-size: larger; background-color: #f0f0f0; color: #333; padding: 0.5em;" | '''DeepSeek''' |- ! colspan="2" style="text-align: center; background-color: #f0f0f0; color: #333;" | Informations générales |- | Nom | DeepSeek |- | Forme juridique | Société privée |- | Fondation | Mai 2023 |- | Siège social | Hangzhou, Zhejiang, Chine |- | Direction...
 
Aucun résumé des modifications
Ligne 55 : Ligne 55 :
== Importance et critiques ==
== Importance et critiques ==


DeepSeek s'est imposé comme un acteur majeur dans le domaine des modèles d'IA open source. L'entreprise a attiré l'attention grâce à son utilisation efficace des ressources et à la fourniture de modèles performants. Cependant, DeepSeek a également fait face à des critiques, notamment concernant la transparence de ses résultats de benchmarks et les implications éthiques du développement de l'IA.
DeepSeek s'est imposé comme un acteur majeur dans le domaine des modèles d'IA open source. L'entreprise a attiré l'attention grâce à son utilisation efficace des ressources et à la fourniture de modèles performants. Cependant, DeepSeek a également fait face à des critiques, notamment en ce qui concerne les implications éthiques du développement de l'IA. Les discussions se concentrent sur des questions telles que la responsabilité des décisions prises par l'IA, les biais potentiels dans les modèles et les impacts à long terme sur la société.


== Liens externes ==
== Liens externes ==

Version du 28 décembre 2024 à 16:40

DeepSeek
Informations générales
Nom DeepSeek
Forme juridique Société privée
Fondation Mai 2023
Siège social Hangzhou, Zhejiang, Chine
Direction Liang Wenfeng (PDG)
Secteur d'activité Technologie de l'information
Site web www.deepseek.com

DeepSeek est une entreprise chinoise basée à Hangzhou, spécialisée dans le développement de l'Intelligence Artificielle (IA). Fondée en mai 2023, elle est une filiale du fonds spéculatif chinois High-Flyer. DeepSeek se concentre sur la création de modèles d'IA open source, optimisés pour des applications mathématiques et liées à la programmation.

Histoire

DeepSeek a été créée en mai 2023 en tant qu'entité indépendante du fonds spéculatif High-Flyer. High-Flyer lui-même a été fondé en 2015 par trois ingénieurs de l'Université du Zhejiang, qui ont commencé à trader des actions pendant la crise financière de 2007–2008. L'entreprise a utilisé l'apprentissage automatique pour développer des stratégies de trading et a souvent été comparée à Renaissance Technologies en raison de son utilisation d'algorithmes d'IA.[1]

En avril 2023, High-Flyer a annoncé la création d'une nouvelle unité dédiée à la recherche sur l'intelligence artificielle générale (IAG), indépendante de ses activités financières. Cette unité a été officiellement lancée en mai 2023 sous le nom de DeepSeek.[2]

Technologie et modèles

DeepSeek développe des modèles de langage (LLMs) optimisés pour diverses applications telles que la génération de texte, la programmation et la résolution de problèmes mathématiques. Les modèles de l'entreprise sont disponibles en open source et se sont distingués par leur performance et leur efficacité.

DeepSeek Coder

Le 2 novembre 2023, DeepSeek a lancé son premier modèle, DeepSeek Coder, conçu spécifiquement pour les tâches de programmation. Il est gratuit pour un usage commercial et entièrement open source.[3]

DeepSeek LLM et DeepSeek Chat

Le 29 novembre 2023, DeepSeek a présenté DeepSeek LLM, un modèle de langage massif comptant jusqu'à 67 milliards de paramètres. Conçu pour rivaliser avec d'autres LLM leaders comme GPT-4, il a toutefois rencontré des défis en termes d'efficacité de calcul et de scalabilité. Parallèlement, DeepSeek Chat, une application de chat basée sur ce modèle, a été lancée.[4]

DeepSeek-V2

En mai 2024, DeepSeek a lancé DeepSeek-V2, un modèle offrant une performance élevée à un prix relativement bas. Avec un coût de 2 RMB (environ 0,25 euro) par million de tokens de sortie, il a déclenché une guerre des prix sur le marché chinois de l'IA et a été surnommé le "Pinduoduo de l'IA". DeepSeek-V2 a été classé septième dans le classement des LLM du Tiger Lab de l'Université de Waterloo.[5]

DeepSeek R1-Lite-Preview

En novembre 2024, DeepSeek a publié R1-Lite-Preview, un modèle optimisé pour le raisonnement logique, l'argumentation mathématique et la résolution de problèmes en temps réel. DeepSeek a affirmé qu'il surpassait OpenAI o1 dans des benchmarks comme l'American Invitational Mathematics Examination (AIME) et MATH. Cependant, des tests indépendants du Wall Street Journal ont montré qu'OpenAI o1 était plus rapide pour résoudre les problèmes de l'AIME.[6]

DeepSeek-V3

En décembre 2024, DeepSeek a dévoilé DeepSeek-V3, un modèle de 671 milliards de paramètres, entraîné en seulement deux mois pour un coût de 5,58 millions de dollars américains. Il a été entraîné sur un ensemble de données de 14,8 billions de tokens et a surpassé des modèles comme Llama 3.1 et Qwen 2.5 dans les tests de référence, tout en égalant GPT-4o et Claude 3.5 Sonnet. L'utilisation efficace des ressources a souligné les limites des sanctions américaines sur le développement de l'IA en Chine.[7]

Importance et critiques

DeepSeek s'est imposé comme un acteur majeur dans le domaine des modèles d'IA open source. L'entreprise a attiré l'attention grâce à son utilisation efficace des ressources et à la fourniture de modèles performants. Cependant, DeepSeek a également fait face à des critiques, notamment en ce qui concerne les implications éthiques du développement de l'IA. Les discussions se concentrent sur des questions telles que la responsabilité des décisions prises par l'IA, les biais potentiels dans les modèles et les impacts à long terme sur la société.

Liens externes

Références

  1. (en) « Billions Going to China's Quants Takes Fight to Global Funds », Bloomberg News,‎ (lire en ligne)
  2. (en) Xu Yu, « [Exclusive] Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says » [archive du ], sur Yicai Global, (consulté le )
  3. (en) Ksenia Se, « Inside DeepSeek Models » [archive du ], sur Turing Post, (consulté le )
  4. (en-US) Shubham Sharma, « Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model » [archive du ], sur VentureBeat, (consulté le )
  5. (en) Ryan McMorrow, « The Chinese quant fund-turned-AI pioneer », Financial Times,‎ (lire en ligne)
  6. (en-US) Raffaele Huang, « Don't Look Now, but China's AI Is Catching Up Fast » [archive du ], sur The Wall Street Journal, (consulté le )
  7. (en) Ben Jiang, « Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products » [archive du ], sur South China Morning Post, (consulté le )