DeepSeek, cette start-up chinoise qui fait mieux qu'OpenAI pour 96% moins cher

le 24 janvier

Qui a dit qu'il fallait dépenser des milliards pour faire de l'IA générative ? Le modèle DeepSeek-R1 atteint des performances comparables à celles du modèle o1 d'OpenAI pour les tâches de mathématiques, de code et de raisonnement. Pour soutenir la communauté, la start-up a mis en libre accès DeepSeek-R1-Zero, DeepSeek-R1 et six modèles denses distillés à partir de DeepSeek-R1, basés sur Llama et Qwen.

"Nous vivons dans une époque où une entreprise non américaine porte le flambeau de la mission originale d'OpenAI - une recherche véritablement ouverte qui donne du pouvoir à tous", s'exclame Jim Fan, senior research manager and lead of embodied AI au sein de Nvidia sur LinkedIn. Ce dernier fait référence à DeepSeek, une start-up chinoise qui a dévoilé cette semaine ses modèles de raisonnement de première génération, DeepSeek-R1-Zero et DeepSeek-R1.

Une publication sous licence MIT

Leur point fort ? Des performances équivalentes à o1-1217 d'OpenAI, mais pour beaucoup moins cher... et en open source aussi bien pour les chercheurs que les entreprises. "Afin de soutenir la communauté de recherche, nous mettons en open source DeepSeek-R1-Zero, DeepSeek-R1, et six modèles denses (1,5B, 7B, 8B, 14B, 32B, 70B) distillés à partir de DeepSeek-R1 basé sur Qwen et Llama", précise la start-up. Publié sous licence MIT, DeepSeek-R1 est donc libre de modification, d'ajustement et de commercialisation, contrairement à OpenAI et à son écosystème fermé.

Le coup de grâce ? DeepSeek n'est qu'une filiale de High-Flyer Capital Management, une société de gestion quantitative de fonds lancée initialement en 2015. Développer des modèles n'est donc pas à proprement parler son activité principale, mais un projet à côté porté par des salariés pour mettre à profit ses GPU lorsqu'ils ne sont pas utilisés. Cette petite structure a donc développé ses modèles aux performances équivalentes à ceux d'OpenAI en ne disposant que de ressources très limitées, sans avoir eu à investir des centaines de milliards de dollars... ni même des centaines de millions.

La suite ici : https://www.usine-digitale.fr/article/deepseek-cette-start-up-chinoise-qui-fait-mieux-qu-openai-pour-96-moins-cher.N2226172

le 24 janvier

Ça fait peur, rien que le nom de la startup évoque en creux la préfiguration d'une domination technologique prête à fistfucker les géants occidentaux du secteur ...

le 28 janvier

Le 1/24/2025 à 19:49, Tequila Moor a dit :

Le coup de grâce ? DeepSeek n'est qu'une filiale de High-Flyer Capital Management, une société de gestion quantitative de fonds lancée initialement en 2015. Développer des modèles n'est donc pas à proprement parler son activité principale, mais un projet à côté porté par des salariés pour mettre à profit ses GPU lorsqu'ils ne sont pas utilisés.

Pour l'instant on n'a pas encore pu vérifier cela. J'ai entendu dire que des chercheurs sont en train de répliquer leur méthode pour voir si réellement ils ont pu aboutir à ce résultat avec si peu de puissance de calcul.
Mais si c'est vrai, c'est vraiment une grosse claque.

Connexion

DeepSeek, cette start-up chinoise qui fait mieux qu'OpenAI pour 96% moins cher

Messages recommandés

Tequila Moor 12 021

Une publication sous licence MIT

Lien à poster

Partager sur d’autres sites

BadKarma 11 236

Lien à poster

Partager sur d’autres sites

garthriter 6 124

Lien à poster

Partager sur d’autres sites

Rejoindre la conversation

Contenu similaire

Bienvenue sur Forum Fr !

FFr Mag' 2.0

Dire à un ami

Connexion

DeepSeek, cette start-up chinoise qui fait mieux qu'OpenAI pour 96% moins cher

Messages recommandés

Tequila Moor 12 021

Une publication sous licence MIT

Lien à poster

Partager sur d’autres sites

BadKarma 11 236

Lien à poster

Partager sur d’autres sites

garthriter 6 124

Lien à poster

Partager sur d’autres sites

Rejoindre la conversation

Contenu similaire

Bienvenue sur Forum Fr !

FFr Mag' 2.0

Dire à un ami

Tequila Moor 12 021

BadKarma 11 236

garthriter 6 124