- Story
Qu’est-ce que DeepSeek, le concurrent chinois de ChatGPT ?
07.02.2025 L'IA chinoise DeepSeek semble être en train de bouleverser le monde (de l'IA). Sarah Dégallier Rochat de la BFH classe cette évolution du point de vue d'une numérisation humaine.
En bref
- DeepSeek remet en question le récit de la domination des IA américaines.
- L'IA chinoise semble moins gourmande en énergie et moins chère que sa concurrente américaine.
- DeepSeek remet en question la domination du fabricant de puces d'IA Nvidia.
- DeepSeek ouvre partiellement son code source (open source) et est donc relativement transparent.
DeepSeek est une start-up chinoise fondée en 2023, spécialisée dans l’intelligence artificielle. Elle a développé un modèle dont les performances sont comparables à celles de ChatGPT, tout en étant nettement plus économe en puissance de calcul et en coût de développement.
Son modèle repose en partie sur une approche open source : un document détaille son architecture et ses paramètres sont accessibles au public. Cette application crée une petite révolution dans le monde de l’IA : Seulement quelques jours après son lancement, DeepSeek a surpassé ChatGPT en nombre de téléchargements sur l’App Store d’Apple.
Pourquoi parle-t-on tant de ce modèle ?
DeepSeek remet en question le récit dominant autour de l’intelligence artificielle, largement façonné par les grandes entreprises technologiques américaines. Jusqu’à présent, ces compagnies justifiaient des investissements massifs en avançant plusieurs arguments stratégiques :
- L’IA comme enjeu géopolitique – L’idée que l’IA finira par surpasser l’intelligence humaine et deviendra un outil de domination technologique pousse à un investissement immédiat et massif. Aux États-Unis, cela se traduit par une volonté de garder une avance sur la Chine, perçue comme un rival dans une course contre la montre pour le développement de l’IA.
- La puissance de calcul comme condition du progrès – Selon ce narratif, une IA plus performante nécessiterait toujours plus de puissance de calcul, avec un impact écologique considéré comme un dommage collatéral inévitable.
- La suprématie des Big Tech américaines – Il serait impossible de développer des modèles d’IA de pointe sans les ressources financières, l’expertise et l’accès exclusif aux technologies avancées dont disposent les géants américains.
DeepSeek remet en question ces postulats en développant, en un temps relativement court, un modèle aussi performant que ceux de ChatGPT, tout en rendant son architecture partiellement open source.
Ce succès ne se limite pas à une avancée technologique : il ébranle l’idée d’une supériorité américaine dans l’IA et remet en cause la logique de compétition sur des modèles propriétaires.
En quoi DeepSeek est-il révolutionnaire ?
DeepSeek démontre qu’en optimisant les algorithmes plutôt qu’en augmentant la puissance de calcul, il est possible de concevoir des modèles tout aussi efficaces à moindre coût, tant sur le plan économique qu’écologique.
L’arrivée de DeepSeek sur le marché a coïncidé avec l’annonce par le gouvernement américain de l’opération StarGate, un plan d’investissement de 500 milliards de dollars dans l’IA. Or, selon les informations disponibles, l’entraînement de DeepSeek aurait coûté moins de 6 millions de dollars (contre 100 millions pour ChatGPT) et nécessité 10 fois moins de puissance de calcul.
Cela ne signifie pas la fin de la course à la puissance de calcul, mais cela va obliger les entreprises américaines à investir plus dans le développement de systèmes plus efficaces.
Cette avancée a donc des répercussions directes sur les grandes entreprises américaines :
D’une part, elle remet en cause leur monopole technologique et leur justification d’investissements colossaux, mais elle met également en évidence que ces entreprises n’ont pas fait du développement d’algorithmes moins gourmands une priorité, malgré le coût écologique de l’IA.
D’autre part, elle crée une pression concurrentielle sur les prix : alors qu’OpenAI envisageait d’augmenter ses tarifs pour couvrir ses coûts, DeepSeek propose une alternative beaucoup plus abordable (20 à 50 fois moins chère), ce qui va les obliger à soit revoir leur modèle économique, soit proposer des modèles avec des performances nettement plus élevées pour rester compétitifs.
La mise sur le marché de DeepSeek coïncide avec une chute en bourse de l’entreprise NVIDIA. Quel est le lien?
NVIDIA, leader mondial des puces spécialisées pour l’IA, a vu son action chuter de 17 %, entraînant une perte de 593 milliards de dollars de valorisation boursière. Cette baisse peut s’expliquer par une perte de confiance des investisseurs.
En effet, jusqu’à présent, les NVIDIA était considéré comme un acteur incontournable pour le développement de l’IA, notamment grâce à ses puces haut de gamme. Ces puces ne sont cependant pas disponibles en Chine en raison des restrictions américaines sur les exportations vers la Chine.
Or, DeepSeek a réussi à entraîner un modèle performant en utilisant des puces moins évoluées. Cela suggère que l’innovation logicielle et l’optimisation des algorithmes peuvent compenser un accès limité au matériel de pointe, ce qui affaiblit le monopole perçu de NVIDIA.
C’est une bonne nouvelle pour la Suisse, qui n’a aussi plus accès à ces puces puisqu’elle n’a pas été reconnue comme pays allié pour le développement de l’IA par les USA .
On peut donc imaginer que si les autres acteurs de l’IA parviennent à développer des modèles performants avec moins de puissance de calcul, cela pourrait réduire la demande pour les puces ultra-puissantes de NVIDIA à long terme.
Toutefois, on peut aussi argumenter que si le développement de l’IA devient plus abordable, plus d’entreprises pourront se lancer sur le marché, ce qui augmentera la demande en puces.
En somme, la chute de NVIDIA reflète une réaction de marché face à une incertitude grandissante, plutôt qu’une remise en question immédiate de sa position dominante. Toutefois, elle met en lumière le fait que l’avenir de l’IA ne repose pas uniquement sur la puissance brute des puces, mais aussi sur l’innovation algorithmique.
Est-ce que l’arrivée de DeepSeek est une bonne nouvelle pour le monde de l’IA?
Oui, car, si les informations que l’on a sont correctes, DeepSeek prouve qu’il est possible d’atteindre des performances comparables à celles des modèles les plus avancés tout en consommant beaucoup moins d’énergie.
Cela devrait inciter les entreprises américaines à optimiser leurs modèles plutôt que d’augmenter constamment la puissance de calcul, ce qui aurait un impact positif sur l’empreinte écologique de l’IA.
De plus, en rendant son modèle partiellement accessible, DeepSeek encourage une approche plus ouverte et collaborative du développement de l’IA. Cela s’oppose au modèle propriétaire adopté par des entreprises comme OpenAI, qui centralise le pouvoir entre les mains de quelques acteurs dominants.
Finalement, la réussite de DeepSeek montre qu’une jeune start-up avec une équipe relativement petite peut rivaliser avec les géants américains de l’IA, ce qui remet en cause leur monopole et pourrait mener à une offre plus diversifiée et moins coûteuse pour les utilisateurs.
Cependant, dans les faits, il y a déjà beaucoup d’acteurs qui travaillent au développement de modèle open source plus petits et plus efficaces (par exemple, SmolLM de HuggingFace), mais ces modèles n’ont pas la même résonnance médiatique.
De plus DeepSeek est un modèle « chain of thoughts » comme o1 de ChatGPT – c’est-à-dire un modèle qui simule le raisonnement humain en décomposant les problèmes en plusieurs étapes – ce qui veut dire que même s’il nécessite moins d’énergie pour être développé (entraînement), il en consomme plus qu’un système classique à l’utilisation (inférence).
Quelles sont les conséquences du fait que le système soit chinois?
Il y a deux conséquences principales : la vision du monde propagée par le modèle et l’usage des données des utilisateurs.
Le fait que DeepSeek soit développé en Chine a des implications sur l’information qui est jugée « acceptable ». Chaque modèle est adapté afin d’assurer le plus possible qu’aucun contenu jugé offensif ne soit généré par le système.
Comme attendu, DeepSeek évite certains sujets sensibles pour le gouvernement chinois, comme Tian’anmen ou les Ouïghours. Toutefois, plutôt que de fournir des informations erronées, le système répond qu’il ne peut pas s’exprimer sur le sujet, ce qui est une approche plus transparente.
Il est en revanche probable que, sur des questions historiques ou géopolitiques moins évidentes, le modèle reflète une perspective chinoise plutôt qu’américaine ou occidentale et transmette (volontairement ou non) de fausses informations.
Cela dit, tous les modèles d’IA ont des biais, y compris ceux développés aux États-Unis, où les récits historiques et politiques sont également influencés par des visions nationales. De plus, vu que DeepSeek est (partiellement) open source, les utilisateurs ont la possibilité de réentraîner le modèle avec des données plus diversifiées pour atténuer certains biais et adapter la vision dominante du système.
Pourquoi est-il important que DeepSeek soit open source ?
Le fait que DeepSeek soit partiellement open source permet aussi d’éviter certaines inquiétudes sur la sécurité des données. En effet, il est possible d’installer et d’exécuter le modèle sur son propre serveur, évitant ainsi de partager des données avec la Chine. Cependant, la plupart des utilisateurs utiliseront probablement les serveurs chinois mis à disposition. La question de l’utilisation des données est cependant la même pour les systèmes chinois ou américains.
Il est possible que DeepSeek ait choisi l’open source précisément pour permettre ces ajustements et ainsi rassurer la communauté internationale sur l’usage du modèle. En revanche, la question se pose de savoir si cet outil, une fois largement adopté, ne pourrait pas être utilisé à des fins de propagande.
Si la question se pose aussi pour les modèles américains, le risque avec un système chinois peut sembler plus grand.
Que disent les sceptiques à propos de DeepSeek ?
Il est important de noter que certains observateurs pensent que les informations partagées par DeepSeek (coût d’entraînement, nombre de puces, …) ne correspondent pas à la réalité et reflète plutôt une opération marketing pour entrer le marché mondial.
De plus, il semblerait que DeepSeek ait été entraîné sur la base de ChatGPT, ce qui leur a permis de profiter du travail déjà effectué par OpenAI.
De manière assez cocasse, OpenAI se plaint maintenant que son contenu a été volé pour entraîner DeepSeek. Et ce, bien qu'OpenAI ait admis avoir entraîné son modèle sur du contenu propriétaire sans autorisation (voir les articles de The Guardian ou Futurism).