En regardant mon fil d’actualités sur Bluesky, quelque chose a attiré mon attention : une startup chinoise, DeepSeek, venait de détrôner ChatGPT sur l’App Store américain.
DeepSeek est une startup chinoise d’IA fondée en 2021 par Yan Guiping (ancien de Baidu) et basée à Shanghai. L’entreprise s’est particulièrement fait remarquer pour son engagement envers l’open source – la plupart de leurs modèles sont disponibles publiquement sur Hugging Face.
J’avoue avoir d’abord été sceptique – encore une entreprise qui fait des promesses démesurées d’origine chinoise ? Mais en creusant un peu, j’ai réalisé que c’était bien plus intéressant que ça.
Ce qui me fascine particulièrement, c’est leur approche. Alors que tout le monde nous répète que l’IA nécessite des investissements pharaoniques (je pense notamment aux 100 millions de dollars évoqués par Sam Altman pour GPT-4), DeepSeek affirme avoir développé son modèle pour moins de 6 millions.
Leur nouveau modèle R1, sorti le 20 janvier, rivaliserait avec les performances des grands du secteur. Les marchés financiers semblent avoir été aussi perturbés que moi : Nvidia a descendu ce matin en bourse (-12% !).
Ce qui m’a le plus surpris, c’est leur utilisation des ressources. – DeepSeek prétend en avoir utilisé 8x moins de puces que ses rivaux (2000 versus 16000 pour les autres). Si c’est vrai, ça remet en question toute la stratégie des géants du silicone valley. (Stargate à 500 milliards…)
Bien sûr, il faut rester prudent – ces affirmations doivent encore être vérifiées. Mais si DeepSeek dit vrai, on assiste peut-être à un tournant important dans l’industrie de l’IA.
À votre avis, est-ce que DeepSeek va vraiment réussir à bouleverser le paysage de l’IA ?