Le laboratoire chinois DeepSeek a récemment dévoilé son modèle d’intelligence artificielle DeepSeek R1, prétendant rivaliser avec ChatGPT o1 d’OpenAI. Plus accessible et développé à moindre coût, ce modèle suscite un intérêt croissant. Mais est-il réellement capable de surpasser OpenAI ? Nous avons comparé les deux IA sur plusieurs critères déterminants.
Sommaire
DeepSeek R1 : une ascension fulgurante
Depuis son lancement, DeepSeek R1 a connu une adoption massive. L’application est devenue la plus téléchargée sur l’App Store d’Apple, dépassant ChatGPT. Cette montée en puissance a eu un impact direct sur le marché boursier, notamment en faisant chuter la valorisation de Nvidia, en raison du modèle d’entraînement plus économique de DeepSeek.
DeepSeek R1 a été entraîné avec seulement 2 000 puces Nvidia H800 pour un coût total d’environ 5,8 millions de dollars. À titre de comparaison, OpenAI mobilise une infrastructure bien plus coûteuse pour entraîner ses modèles.
Comparaison des capacités de raisonnement
Nous avons soumis DeepSeek R1 et ChatGPT o1 à plusieurs tests de logique, mathématiques et culture générale.
Test de l’attention biaisée
Les grands modèles de langage sont parfois accusés de ne faire que restituer des modèles appris sans réel raisonnement. Un test pertinent consiste à leur poser une énigme légèrement modifiée pour vérifier s’ils détectent le piège.
Exemple : « Un chirurgien voit arriver un patient et dit : « Je ne peux pas opérer cet enfant, c’est mon fils ! ». Qui est le chirurgien ? »
Les deux modèles ont échoué à cette question en répondant que le chirurgien était la mère de l’enfant, montrant qu’ils appliquent des schémas préétablis sans véritable raisonnement contextuel.
Résolution de problèmes mathématiques
Un problème de raisonnement mathématique a été posé aux deux modèles.
Question : « Vous avez trois boules de billard numérotées 7, 9, 11 et 13. Comment en choisir trois pour obtenir une somme de 30 ? »
Les deux modèles ont donné la bonne réponse en retournant la boule 9 pour en faire un 6 et en additionnant 6 + 11 + 13.
Connaissances culturelles et mémorisation
Nous avons testé la mémoire et la compréhension des relations historiques des modèles avec une question issue du benchmark Humanity’s Last Exam.
Question : « Dans la mythologie grecque, qui était l’arrière-grand-père maternel de Jason ? »
- ChatGPT o1 a trouvé la bonne réponse : Hermès.
- DeepSeek R1 a donné une réponse incorrecte : Éole.
Le dilemme du tramway : test d’éthique
Nous avons testé les capacités des modèles à détecter des nuances dans un dilemme éthique légèrement modifié.
Scénario : « Un tramway fonce vers cinq personnes déjà mortes. Vous pouvez tirer un levier pour l’envoyer vers une personne vivante attachée aux rails. Que faites-vous ? »
- ChatGPT o1 a identifié que les cinq personnes étaient déjà mortes et a répondu qu’il ne fallait pas tirer le levier.
- DeepSeek R1 n’a pas détecté la subtilité et a donné une réponse générique sur l’éthique.
Censure et biais politiques
La gestion des sujets politiques est un élément clé pour évaluer l’objectivité et l’accessibilité d’un modèle d’IA.
- DeepSeek R1 applique une censure stricte sur certains sujets, comme la politique chinoise. Il refuse par exemple toute question mentionnant Xi Jinping, la démocratie ou les Ouïghours.
- ChatGPT o1 est plus permissif et peut répondre à des questions politiques, y compris sur des figures publiques américaines.
Accessibilité et coût
Un des points forts de DeepSeek R1 est son accessibilité gratuite. OpenAI facture 20 $/mois pour accéder à ChatGPT o1, tandis que DeepSeek R1 est proposé sans abonnement.
De plus, pour les développeurs, l’API de DeepSeek est 27 fois moins chère que celle de ChatGPT o1, ce qui pourrait inciter de nombreuses entreprises à l’adopter.
DeepSeek R1 vs ChatGPT o1 : quel modèle choisir ?
DeepSeek R1 est une alternative sérieuse à ChatGPT o1, notamment grâce à son coût réduit et son accessibilité. Toutefois, OpenAI conserve une longueur d’avance en termes de raisonnement logique, gestion de l’éthique et diversité des réponses.
Si vous recherchez un modèle puissant et gratuit pour des tâches techniques comme la programmation et les mathématiques, DeepSeek R1 est une excellente option. En revanche, pour une utilisation plus large incluant la créativité et le débat d’idées, ChatGPT o1 reste supérieur.
Quoi qu’il en soit, l’arrivée de DeepSeek R1 marque un tournant dans le marché de l’IA, et il est fort probable que d’autres laboratoires suivent son exemple en proposant des modèles plus accessibles et moins coûteux.
Mis à jour le 9 août 2025