« DeepSeek » : différence entre les versions

**DeepSeek**
Informations générales
Nom	DeepSeek
Forme juridique	Société privée
Fondation	Mai 2023
Siège social	Hangzhou, Zhejiang, Chine
Direction	Liang Wenfeng (PDG)
Secteur d'activité	Technologie de l'information
Site web	www.deepseek.com

Navigation interactive dans l’historique

Modification suivante →

Contenu supprimé Contenu ajouté

VisuelWikicode

Intégrés

Version du 28 décembre 2024 à 16:40

DeepSeek est une entreprise chinoise basée à Hangzhou, spécialisée dans le développement de l'Intelligence Artificielle (IA). Fondée en mai 2023, elle est une filiale du fonds spéculatif chinois High-Flyer. DeepSeek se concentre sur la création de modèles d'IA open source, optimisés pour des applications mathématiques et liées à la programmation.

Histoire

DeepSeek a été créée en mai 2023 en tant qu'entité indépendante du fonds spéculatif High-Flyer. High-Flyer lui-même a été fondé en 2015 par trois ingénieurs de l'Université du Zhejiang, qui ont commencé à trader des actions pendant la crise financière de 2007–2008. L'entreprise a utilisé l'apprentissage automatique pour développer des stratégies de trading et a souvent été comparée à Renaissance Technologies en raison de son utilisation d'algorithmes d'IA.^[1]

En avril 2023, High-Flyer a annoncé la création d'une nouvelle unité dédiée à la recherche sur l'intelligence artificielle générale (IAG), indépendante de ses activités financières. Cette unité a été officiellement lancée en mai 2023 sous le nom de DeepSeek.^[2]

Technologie et modèles

DeepSeek développe des modèles de langage (LLMs) optimisés pour diverses applications telles que la génération de texte, la programmation et la résolution de problèmes mathématiques. Les modèles de l'entreprise sont disponibles en open source et se sont distingués par leur performance et leur efficacité.

DeepSeek Coder

Le 2 novembre 2023, DeepSeek a lancé son premier modèle, DeepSeek Coder, conçu spécifiquement pour les tâches de programmation. Il est gratuit pour un usage commercial et entièrement open source.^[3]

DeepSeek LLM et DeepSeek Chat

Le 29 novembre 2023, DeepSeek a présenté DeepSeek LLM, un modèle de langage massif comptant jusqu'à 67 milliards de paramètres. Conçu pour rivaliser avec d'autres LLM leaders comme GPT-4, il a toutefois rencontré des défis en termes d'efficacité de calcul et de scalabilité. Parallèlement, DeepSeek Chat, une application de chat basée sur ce modèle, a été lancée.^[4]

DeepSeek-V2

En mai 2024, DeepSeek a lancé DeepSeek-V2, un modèle offrant une performance élevée à un prix relativement bas. Avec un coût de 2 RMB (environ 0,25 euro) par million de tokens de sortie, il a déclenché une guerre des prix sur le marché chinois de l'IA et a été surnommé le "Pinduoduo de l'IA". DeepSeek-V2 a été classé septième dans le classement des LLM du Tiger Lab de l'Université de Waterloo.^[5]

DeepSeek R1-Lite-Preview

En novembre 2024, DeepSeek a publié R1-Lite-Preview, un modèle optimisé pour le raisonnement logique, l'argumentation mathématique et la résolution de problèmes en temps réel. DeepSeek a affirmé qu'il surpassait OpenAI o1 dans des benchmarks comme l'American Invitational Mathematics Examination (AIME) et MATH. Cependant, des tests indépendants du Wall Street Journal ont montré qu'OpenAI o1 était plus rapide pour résoudre les problèmes de l'AIME.^[6]

DeepSeek-V3

En décembre 2024, DeepSeek a dévoilé DeepSeek-V3, un modèle de 671 milliards de paramètres, entraîné en seulement deux mois pour un coût de 5,58 millions de dollars américains. Il a été entraîné sur un ensemble de données de 14,8 billions de tokens et a surpassé des modèles comme Llama 3.1 et Qwen 2.5 dans les tests de référence, tout en égalant GPT-4o et Claude 3.5 Sonnet. L'utilisation efficace des ressources a souligné les limites des sanctions américaines sur le développement de l'IA en Chine.^[7]

Importance et critiques

DeepSeek s'est imposé comme un acteur majeur dans le domaine des modèles d'IA open source. L'entreprise a attiré l'attention grâce à son utilisation efficace des ressources et à la fourniture de modèles performants. Cependant, DeepSeek a également fait face à des critiques, notamment en ce qui concerne les implications éthiques du développement de l'IA. Les discussions se concentrent sur des questions telles que la responsabilité des décisions prises par l'IA, les biais potentiels dans les modèles et les impacts à long terme sur la société.

Liens externes

Site officiel de DeepSeek

Références

↑ (en) « Billions Going to China's Quants Takes Fight to Global Funds », Bloomberg News,‎ 31 mai 2020 (lire en ligne)
↑ (en) Xu Yu, « [Exclusive] Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says » [archive du 31 décembre 2023], sur Yicai Global, 17 avril 2023 (consulté le 28 décembre 2024)
↑ (en) Ksenia Se, « Inside DeepSeek Models » [archive du 18 septembre 2024], sur Turing Post, 28 août 2024 (consulté le 28 décembre 2024)
↑ (en-US) Shubham Sharma, « Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model » [archive du 23 décembre 2024], sur VentureBeat, 1^er décembre 2023 (consulté le 28 décembre 2024)
↑ (en) Ryan McMorrow, « The Chinese quant fund-turned-AI pioneer », Financial Times,‎ 9 juin 2024 (lire en ligne)
↑ (en-US) Raffaele Huang, « Don't Look Now, but China's AI Is Catching Up Fast » [archive du 27 décembre 2024], sur The Wall Street Journal, 24 décembre 2024 (consulté le 28 décembre 2024)
↑ (en) Ben Jiang, « Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products » [archive du 27 décembre 2024], sur South China Morning Post, 27 décembre 2024 (consulté le 28 décembre 2024)

[1] (en) « Billions Going to China's Quants Takes Fight to Global Funds », Bloomberg News,‎ 31 mai 2020 (lire en ligne)

[2] (en) Xu Yu, « [Exclusive] Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says » [archive du 31 décembre 2023], sur Yicai Global, 17 avril 2023 (consulté le 28 décembre 2024)

[:1-3] (en) Ksenia Se, « Inside DeepSeek Models » [archive du 18 septembre 2024], sur Turing Post, 28 août 2024 (consulté le 28 décembre 2024)

[4] (en-US) Shubham Sharma, « Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model » [archive du 23 décembre 2024], sur VentureBeat, 1^er décembre 2023 (consulté le 28 décembre 2024)

[:2-5] (en) Ryan McMorrow, « The Chinese quant fund-turned-AI pioneer », Financial Times,‎ 9 juin 2024 (lire en ligne)

[6] (en-US) Raffaele Huang, « Don't Look Now, but China's AI Is Catching Up Fast » [archive du 27 décembre 2024], sur The Wall Street Journal, 24 décembre 2024 (consulté le 28 décembre 2024)

[7] (en) Ben Jiang, « Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products » [archive du 27 décembre 2024], sur South China Morning Post, 27 décembre 2024 (consulté le 28 décembre 2024)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

@@ Ligne 55 : / Ligne 55 : @@
 == Importance et critiques ==
-DeepSeek s'est imposé comme un acteur majeur dans le domaine des modèles d'IA open source. L'entreprise a attiré l'attention grâce à son utilisation efficace des ressources et à la fourniture de modèles performants. Cependant, DeepSeek a également fait face à des critiques, notamment concernant la transparence de ses résultats de benchmarks et les implications éthiques du développement de l'IA.
+DeepSeek s'est imposé comme un acteur majeur dans le domaine des modèles d'IA open source. L'entreprise a attiré l'attention grâce à son utilisation efficace des ressources et à la fourniture de modèles performants. Cependant, DeepSeek a également fait face à des critiques, notamment en ce qui concerne les implications éthiques du développement de l'IA. Les discussions se concentrent sur des questions telles que la responsabilité des décisions prises par l'IA, les biais potentiels dans les modèles et les impacts à long terme sur la société.
 == Liens externes ==