DeepSeek-R1: OpenAI'nin Model o1'ine Rakip Açık Kaynaklı Bir Platform
DeepSeek-R1, sonunda kullanıcılarla buluştu ve artık açık kaynaklı bir platform olarak hizmet sunmaya başladı. OpenAI'nin Model o1'ine rakip olarak çıkan bu platform, web, uygulama ve API üzerinden erişilebilir durumda.
DeepSeek-R1 Nedir ve Nasıl Kullanılır?
DeepSeek-R1, kullanıcıların bilinmeyene doğru adım atmalarını sağlayan, yapay zeka destekli bir platformdur. Bu platformu kullanarak DeepSeek-V3'e ücretsiz erişim sağlayabilir ve akıllı modelin sunduğu deneyimi yaşayabilirsiniz.
DeepSeek Uygulaması ve Hareket Halindeyken Kullanımı
DeepSeek, mobil uygulama olarak da hizmet vermektedir. DeepSeek-V3 ile hareket halindeyken dahi bu uygulamayı kullanarak yapay zeka destekli sohbetler gerçekleştirebilirsiniz. Tüm bunların yanı sıra, DeepSeek size ücretsiz hepsi bir arada bir AI aracı sunmaktadır.
DeepSeek-R1 ve OpenAI Arasındaki Farklar Nelerdir?
OpenAI'nin Model o1'i ile DeepSeek-R1 arasında bazı temel farklar bulunmaktadır. DeepSeek-R1 açık kaynaklı olmasıyla dikkat çekerken, OpenAI daha kapalı bir yapıya sahiptir. Ayrıca DeepSeek-R1, kullanıcılarına ücretsiz erişim imkanı sunmaktadır.
DeepSeek-R1'in Geleceği
DeepSeek-R1, yapay zeka teknolojilerinin gelişimine katkıda bulunmayı hedefleyen bir platformdur. Gelecekte daha da gelişerek kullanıcılarına benzersiz deneyimler sunmayı planlamaktadır. DeepSeek-R1 ile yapay zeka dünyasının kapılarını aralayabilirsiniz.
Ölçüt (Metrik) | DeepSeek-V3 | DeepSeek-V2.5 | Qwen2.5 | Lama3.1 | Claude-3.5 | GPT-4o |
---|---|---|---|---|---|---|
Aktif Parametreler | 37B | 21B | 72B | 405B | - | - |
Toplam Parametreler | 671B | 236B | 72B | 405B | - | - |
İngilizce | ||||||
MMLU (EM) | 88.5 | 80.6 | 85.3 | 88.6 | 88.3 | 87.2 |
MMLU-Redux (EM) | 89.1 | 80.3 | 85.6 | 86.2 | 88.9 | 88.0 |
MMLU-Pro (EM) | 75.9 | 66.2 | 71.6 | 73.3 | 78.0 | 72.6 |
Düşüş (3-atış F1) | 91.6 | 87.8 | 76.7 | 88.7 | 88.3 | 83.7 |
IF-Eval (İstemli Sıkı) | 86.1 | 80.6 | 84.1 | 86.0 | 86.5 | 84.3 |
GPQA-Elmas (Geçti@1) | 59.1 | 41.3 | 49.0 | 51.1 | 65.0 | 49.9 |
SimpleQA (Doğru) | 24.9 | 10.2 | 9.1 | 17.1 | 28.4 | 38.2 |
Çerçeveler (Aksesuar) | 73.3 | 65.4 | 69.8 | 70.0 | 72.5 | 80.5 |
LongBench v2 (Aksesuar) | 48.7 | 35.4 | 39.4 | 36.1 | 41.0 | 48.1 |
Kod | ||||||
HumanEval-Mul (Geçti@1) | 82.6 | 77.4 | 77.3 | 77.2 | 81.7 | 80.5 |
LiveCodeBench (Pass@1-COT) | 40.5 | 29.2 | 31.1 | 28.4 | 36.3 | 33.4 |
LiveCodeBench (Geçti@1) | 37.6 | 28.4 | 28.7 | 30.1 | 32.8 | 34.2 |
Codeforces (Yüzdelik) | 51.6 | 35.6 | 24.8 | 25.3 | 20.3 | 23.6 |
SWE Doğrulandı (Çözüldü) | 42.0 | 22.6 | 23.8 | 24.5 | 50.8 | 38.8 |
Yardımcı Editör (Acc.) | 79.7 | 71.6 | 65.4 | 63.9 | 84.2 | 72.9 |
Aider-Çok Dilli (Acc.) | 49.6 | 18.2 | 7.6 | 5.8 | 45.3 | 16.0 |
Matematik | ||||||
AIME 2024 (Geçti@1) | 39.2 | 16.7 | 23.3 | 23.3 | 16.0 | 9.3 |
MATEMATİK-500 (EM) | 90.2 | 74.7 | 80.0 | 73.8 | 78.3 | 74.6 |
CNMO 2024 (Geçti@1) | 43.2 | 10.8 | 15.9 | 6.8 | 13.1 | 10.8 |
Çince | ||||||
İPUÇLARI (EM) | 90.9 | 90.4 | 91.4 | 84.7 | 85.4 | 87.9 |
C-Değerlendirme (EM) | 86.5 | 79.5 | 86.1 | 61.5 | 76.7 | 76.0 |
C-SimpleQA (Doğru) | 64.1 | 54.1 | 48.4 | 50.4 | 51.3 | 59.3 |