DeepSeek fait sensation.
Le laboratoire d’intelligence artificielle chinois DeepSeek a récemment fait une entrée remarquée dans l’actualité technologique mondiale. Son application de chatbot a atteint la première place des classements de l’Apple App Store et de Google Play, suscitant l’intérêt des analystes de Wall Street et des experts en technologie. Ces derniers s’interrogent désormais sur la capacité des États-Unis à conserver leur avance dans la course à l’IA, ainsi que sur la pérennité de la demande en puces dédiées à l’intelligence artificielle.
Mais d’où vient DeepSeek, et comment a-t-elle acquis une renommée internationale si rapidement ?
Les origines financières de DeepSeek
DeepSeek est soutenu par High-Flyer Capital Management, un fonds spéculatif quantitatif chinois qui utilise l’IA pour orienter ses décisions d’investissement. Fondé en 2015 par Liang Wenfeng, un passionné d’IA, High-Flyer Capital Management s’est spécialisé dans le développement et le déploiement d’algorithmes d’intelligence artificielle. En 2023, High-Flyer a créé DeepSeek en tant que laboratoire de recherche dédié aux outils d’IA, distinct de ses activités financières. Avec High-Flyer comme investisseur, le laboratoire s’est ensuite transformé en une entreprise indépendante portant le même nom.
Dès ses débuts, DeepSeek a construit ses propres clusters de centres de données pour entraîner ses modèles. Cependant, comme d’autres entreprises chinoises d’IA, DeepSeek a été touché par les restrictions américaines à l’exportation de matériel informatique. Pour entraîner l’un de ses modèles récents, l’entreprise a dû utiliser des puces Nvidia H800, une version moins puissante que les H100, accessibles aux entreprises américaines.
L’équipe technique de DeepSeek est réputée pour être jeune et dynamique. L’entreprise recrute activement des chercheurs en IA titulaires d’un doctorat, issus des meilleures universités chinoises. Elle embauche également des profils sans formation en informatique pour enrichir la compréhension de ses modèles dans divers domaines, selon le New York Times.
Des modèles performants
DeepSeek a dévoilé ses premiers modèles — DeepSeek Coder, DeepSeek LLM et DeepSeek Chat — en novembre 2023. Cependant, c’est au printemps dernier, avec le lancement de la famille de modèles DeepSeek-V2, que l’industrie de l’IA a vraiment commencé à lui accorder de l’attention. DeepSeek-V2, un système polyvalent capable d’analyser du texte et des images, a obtenu d’excellents résultats dans plusieurs benchmarks d’IA, tout en étant bien moins coûteux à exploiter que les modèles concurrents de l’époque. Cette performance a contraint des rivaux locaux comme ByteDance et Alibaba à réduire les prix d’utilisation de certains de leurs modèles, voire à les rendre gratuits.
Le lancement de DeepSeek-V3 en décembre 2024 n’a fait qu’accroître la notoriété de l’entreprise. Selon les tests internes de DeepSeek, ce modèle surpasse à la fois les modèles open source comme Meta Llama et les modèles fermés accessibles uniquement via une API, tels que GPT-4o d’OpenAI.
Une approche disruptive
DeepSeek se distingue par une stratégie tarifaire agressive, proposant ses produits et services bien en dessous des prix du marché, voire gratuitement. L’entreprise attribue cette compétitivité à des avancées technologiques en matière d’efficacité, bien que certains experts remettent en question les chiffres avancés par DeepSeek.
Quoi qu’il en soit, les développeurs ont adopté massivement les modèles de DeepSeek. Bien que ces modèles ne soient pas open source au sens traditionnel, ils sont disponibles sous des licences permissives autorisant une utilisation commerciale. Selon Clem Delangue, PDG de Hugging Face, plus de 500 modèles dérivés de DeepSeek ont été créés sur la plateforme, totalisant 2,5 millions de téléchargements.
Un impact majeur sur l’industrie
Le succès de DeepSeek face à des concurrents plus établis a été qualifié de « révolutionnaire » et parfois « surfait ». Son ascension a notamment contribué à une chute de 18 % de l’action Nvidia lundi dernier et a poussé Sam Altman, PDG d’OpenAI, à réagir publiquement.
Microsoft a annoncé l’intégration de DeepSeek à son service Azure AI Foundry, une plateforme destinée aux entreprises. Interrogé sur l’impact de DeepSeek sur les dépenses en IA de Meta, Mark Zuckerberg a réaffirmé que les investissements dans l’infrastructure d’IA resteraient un « avantage stratégique » pour son entreprise.
Quant à l’avenir de DeepSeek, il reste incertain. Des modèles améliorés sont attendus, mais le gouvernement américain semble de plus en plus préoccupé par ce qu’il perçoit comme une influence étrangère potentiellement néfaste.