Aller au contenu

DeepSeek, cette start-up chinoise qui fait mieux qu'OpenAI pour 96% moins cher

Noter ce sujet


Messages recommandés

Membre, `, Posté(e)
Tequila Moor Membre 16 239 messages
`,
Posté(e)

Qui a dit qu'il fallait dépenser des milliards pour faire de l'IA générative ? Le modèle DeepSeek-R1 atteint des performances comparables à celles du modèle o1 d'OpenAI pour les tâches de mathématiques, de code et de raisonnement. Pour soutenir la communauté, la start-up a mis en libre accès DeepSeek-R1-Zero, DeepSeek-R1 et six modèles denses distillés à partir de DeepSeek-R1, basés sur Llama et Qwen.

DeepSeek, cette start-up chinoise qui fait mieux qu'OpenAI pour 96% moins cher

"Nous vivons dans une époque où une entreprise non américaine porte le flambeau de la mission originale d'OpenAI - une recherche véritablement ouverte qui donne du pouvoir à tous", s'exclame Jim Fan, senior research manager and lead of embodied AI au sein de Nvidia sur LinkedIn. Ce dernier fait référence à DeepSeek, une start-up chinoise qui a dévoilé cette semaine ses modèles de raisonnement de première génération, DeepSeek-R1-Zero et DeepSeek-R1.

Une publication sous licence MIT

Leur point fort ? Des performances équivalentes à o1-1217 d'OpenAI, mais pour beaucoup moins cher... et en open source aussi bien pour les chercheurs que les entreprises. "Afin de soutenir la communauté de recherche, nous mettons en open source DeepSeek-R1-Zero, DeepSeek-R1, et six modèles denses (1,5B, 7B, 8B, 14B, 32B, 70B) distillés à partir de DeepSeek-R1 basé sur Qwen et Llama", précise la start-up. Publié sous licence MIT, DeepSeek-R1 est donc libre de modification, d'ajustement et de commercialisation, contrairement à OpenAI et à son écosystème fermé.

Le coup de grâce ? DeepSeek n'est qu'une filiale de High-Flyer Capital Management, une société de gestion quantitative de fonds lancée initialement en 2015. Développer des modèles n'est donc pas à proprement parler son activité principale, mais un projet à côté porté par des salariés pour mettre à profit ses GPU lorsqu'ils ne sont pas utilisés. Cette petite structure a donc développé ses modèles aux performances équivalentes à ceux d'OpenAI en ne disposant que de ressources très limitées, sans avoir eu à investir des centaines de milliards de dollars... ni même des centaines de millions.

La suite ici : https://www.usine-digitale.fr/article/deepseek-cette-start-up-chinoise-qui-fait-mieux-qu-openai-pour-96-moins-cher.N2226172

Lien à poster
Partager sur d’autres sites

Annonces
Maintenant
Membre, Docteur Honoris Causa es "Patati & Patata ...", 62ans Posté(e)
BadKarma Membre 14 798 messages
62ans‚ Docteur Honoris Causa es "Patati & Patata ...",
Posté(e)

Ça fait peur, rien que le nom de la startup évoque en creux la préfiguration d'une domination technologique prête à fistfucker les géants occidentaux du secteur ...

  • Haha 1
Lien à poster
Partager sur d’autres sites

Membre, Posté(e)
garthriter Membre 6 776 messages
Maitre des forums‚
Posté(e)
Le 1/24/2025 à 19:49, Tequila Moor a dit :

Le coup de grâce ? DeepSeek n'est qu'une filiale de High-Flyer Capital Management, une société de gestion quantitative de fonds lancée initialement en 2015. Développer des modèles n'est donc pas à proprement parler son activité principale, mais un projet à côté porté par des salariés pour mettre à profit ses GPU lorsqu'ils ne sont pas utilisés.

Pour l'instant on n'a pas encore pu vérifier cela. J'ai entendu dire que des chercheurs sont en train de répliquer leur méthode pour voir si réellement ils ont pu aboutir à ce résultat avec si peu de puissance de calcul.
Mais si c'est vrai, c'est vraiment une grosse claque.

  • Like 1
Lien à poster
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

Chargement
×