DeepSeek R1: Çin'in OpenAI'ye tepkisi tüm beklentileri aşıyor

Adanali · 23 Ocak 2025

Çin yapay zeka alanında ABD'yi yakalamaya çalışıyor

(Resim: KaimDH/Shutterstock.com)

Çin yapay zekayı büyük ölçüde geliştiriyor. Yeni DeepSeek R1 dil modeli önemli testlerde en iyi sonuçları elde ediyor. Ve rekabetin aksine, ücretsiz bir lisansa dayanmaktadır.

Donald Trump yapay zeka sektörüne milyar dolarlık yatırımlar açıklarken, Çin yapay zeka laboratuvarı DeepSeek Pazartesi günü insanları düşündüren iki yeni yapay zeka dil modeli olan DeepSeek-R1-Zero ve DeepSeek-R1'i yayınladı: l şirketi için ikinci, modeller, OpenAI'nin devrim niteliğindeki o1 modeliyle karşılaştırılabilecek bazı kıyaslamalarda, maliyetin çok altında bir maliyetle ve ücretsiz lisanslama modeliyle performans elde ediyor.

Duyuru

Çoğu geleneksel dil modelinin aksine, Çin yapay zekası “simüle edilmiş akıl yürütme” adı verilen bir yaklaşım kullanıyor.

Model, bir sorguyu çözmeye çalışırken insana benzer bir zihinsel süreçler zincirini simüle ediyor. Bu süreç tipik dil modellerinden daha uzun sürer ancak özellikle matematik, fizik ve doğa bilimleri alanlarındaki görevlerde daha iyi sonuçlara yol açar.

OpenAI'nin Eylül 2024'te tanıtılan o1 modeli, bu yaklaşıma dayanan ilk halka açık yapay zeka modeliydi.

Etkileyici kıyaslama sonuçları

Doğu kıyı bölgesi Zhejiang'da bulunan DeepSeek, modellerinin performansını çeşitli kriterlere göre test etti. Aime 2024 matematik testinde DeepSeek-R1 %79,8 puan alırken OpenAI %79,2 ile biraz daha iyi performans gösterdi.

Sözlü problemlerden oluşan bir derleme olan Math 500 değerlendirmesinde model, test edilen diğer tüm sistemleri geride bırakarak %97,3'lük bir doğruluğa bile ulaştı.

Çubuk grafik biçiminde referans sonuçları içeren bir istatistik

OpenAI ile kıyaslama karşılaştırmasında DeepSeeks modelleri

(Resim: DeepSeek)

DeepSeek-R1 aynı zamanda etkileyici programlama yetenekleri de sergiliyor. SWE-bench onaylı programlama değerlendirmesinde model %49,2 puan elde etti. Bu, uzman düzeyinde programlama becerilerini gösterir.

MMLU ve GPQA Diamond gibi genel bilgi testlerinde DeepSeek-R1 sırasıyla yüzde 90,8 ve yüzde 71,5 doğruluk elde etti. AlpacaEval 2.0 yazma ve soru cevaplama kriterinde model %87,6 kazanma oranına ulaştı.

Ancak sonuçlar henüz bağımsız olarak doğrulanmadığından dikkatle yorumlanmalıdır. Ancak: Model aynı zamanda yazarın pratik testinde de iyi bir izlenim bırakıyor ve sürekli olarak OpenAI sürüm o1 ile aynı seviyede.

Model sorulduğunda veritabanının Temmuz 2024'e kadar bilgilerle eğitildiğini açıkladı. OpenAI'nin mevcut modelleri gibi DeepSeek de istenirse ağdan daha yeni bilgileri dahil edebiliyor. Görüntü oluşturma işlevi yoktur.

Ücretsiz ama kısıtlı lisans

DeepSeek, R1 modelini ücretsiz MIT lisansı altında yayınladı. Bu, herkesin sistemi ticari amaçlarla bile kullanmasına ve değiştirmesine olanak tanır.

DeepSeek-R1'in en büyük versiyonu 671 milyar parametre içerir. Şirket ayrıca 1,5 ila 70 milyar parametreye sahip, en küçük versiyonu bir dizüstü bilgisayarda bile çalışabilen daha küçük versiyonlar da sunuyor.

Ticari sektörde, DeepSeek rekabetçi fiyatlarla kendisini piyasaya sürüyor: OpenAIs, o1 sürümü için bir milyon çıkış tokeni için 60 ABD doları tahmin ederken, DeepSeek yalnızca 2,19 ABD doları ücret alıyor. Bu, Çin modelini ABD'deki rakiplerinden yaklaşık %95 daha ucuz hale getiriyor.

Ancak DeepSeek-R1'in temel yapılandırması Çin'e özgü kısıtlamalara tabidir; çünkü Halk Cumhuriyeti'ndeki yapay zeka sistemleri, İnternet hizmeti düzenlemelerine göre “temel sosyalist değerleri” uygulamak zorundadır.

Portal gibi ArsTechnica Sistemin, Tian'anmen Meydanı veya Tayvan'ın durumu gibi siyasi açıdan hassas konulara yanıt vermeyi reddettiği bildiriliyor.

Yazarın testinde DeepSeek ayrıca ChatGPT'den beklediğiniz gibi Almanca sorulan sorulara da detaylı bir şekilde yorum yaptı. Ancak İngilizce sorulduğunda yapay zeka başka bir şey hakkında konuşmayı tercih etti.

Gibi ArsTechnica Rapora göre, açık kaynak lisanslama modeli sayesinde mümkün olan bulut sürümü yerine sistemin yerel olarak barındırılan bir örneğini çalıştırırsanız politik filtreler tamamen atlanabilir.

Ayrıca okuyun

Daha fazlasını göster

Daha az göster

DeepSeek R1'in piyasaya sürülmesi, ABD hükümetinin yapay zeka teknolojilerinin Çin'e ihracatına daha sert kısıtlamalar getirmek istediği bir zamanda geliyor. OpenAI gibi şirketler, Çin modellerinin gelecekte ABD sistemlerini yakalayabileceği ve hatta geçebileceği konusunda şimdiden uyarıda bulunuyor.

DeepSeek, Alibaba ve Moonshot AI ile en az üç Çin laboratuvarı, kendi açıklamalarına göre OpenAI'nin o1'ine ayak uydurabilecek modeller sundu.

George Mason Üniversitesi'nden yapay zeka araştırmacısı Dean Ball'a göre bu eğilim, Çin geliştirme ekiplerinin hızla en ileri teknolojiye doğru ilerlediğini gösteriyor. Özellikle basit ev bilgisayarlarında çalışabilen R1 varyantlarının yeteneklerinin, yapay zeka uygulamalarının daha da yaygınlaşmasına ve demokratikleşmesine katkıda bulunabileceğini vurguladı.

Ball, “DeepSeek'in küçültülmüş modellerinin etkileyici performansı, son derece güçlü muhakeme sistemlerinin hızla yayılacağı ve herhangi bir merkezi kontrol rejiminin (ABD ihracat kontrolleri dahil) gözünden uzakta, yerel donanım üzerinde çalışacağı anlamına geliyor” diye yazıyor.

DeepSeek R1: Çin'in OpenAI'ye tepkisi tüm beklentileri aşıyor

Adanali

Member