Çinli teknoloji girişimi DeepSeek, yalnızca iki yıl içinde büyük bir başarıya imza atarak yapay zeka alanında rakiplerini geride bırakmaya başladı. Şirket, 26 Aralık 2024'te piyasaya sürdüğü DeepSeek V3 adlı yeni yapay zeka sohbet robotuyla sektörde dikkatleri üzerine topladı. Bu model, büyük teknoloji şirketlerinin milyarlarca dolar harcadığı yapay zeka araçlarına karşı düşük bütçeyle üstün performans sergileyerek, sektördeki güç dengelerini sarsmaya başladı.
Düşük Maliyet ve Yüksek Verimlilikle Devasa Dönüşüm
DeepSeek'in DeepSeek V3 modeli, yalnızca 5,58 milyon dolar gibi küçük bir bütçeyle geliştirildi ve sadece 2 ayda eğitildi. Bu hızlı gelişim, sektörün devlerini şaşkına çevirdi. Modelin eğitiminde Nvidia'nın H800 grafik işlemci birimleri (GPU) kullanıldı, ancak bu donanımlar ABD'nin Çin'e yönelik ihracat kısıtlamalarına uyum sağlamak amacıyla daha düşük teknolojiliydi. Buna rağmen, modelin eğitim süreci 2,78 milyon GPU saatiyle tamamlanarak, daha ileri teknolojili çiplerle yapılan eğitim süreçlerine göre çok daha kısa bir süreye denk geldi.
Rakiplerinden Daha Yüksek Performans gösterdi
DeepSeek V3, yapılan kapsamlı testlerde birçok büyük modelden daha yüksek performans sergiledi. Meta'nın Llama 3.1, Alibaba'nın Qwen 2.5 ve Microsoft destekli OpenAI'ın GPT-4 gibi büyük yatırımlar gerektiren modellerle karşılaştırıldığında, DeepSeek V3 metin anlama, alan uzmanlığı bilgisi, kodlama ve matematiksel problem çözme gibi testlerde daha başarılı sonuçlar elde etti.
Kısıtlamalara rağmen başarılı oldu
DeepSeek'in düşük maliyetle geliştirdiği bu model, ABD'nin Çin'e yönelik teknoloji kısıtlamalarını sorgulayan bir etki yarattı. ABD'nin Nvidia gibi çip üreticilerine uyguladığı ihracat kısıtlamaları, Çin'in yapay zeka alanındaki gelişimini engellemeyi amaçlıyor olsa da, DeepSeek'in başarısı, bu stratejinin ne kadar etkili olduğunu sorgulatıyor. Bu durum, aynı zamanda ABD'nin yapay zeka yarışındaki liderliğini de tehdit ediyor.
az veriyle kendisini geliştiriyor
DeepSeek, 20 Ocak 2025’te R1 adını verdiği yeni akıl yürütme modelini piyasaya sürdü. Bu model, daha önce yapılmayan bir yenilik sunmasa da, OpenAI'ın o1 modeline göre daha etkili sonuçlar elde etti. R1, soruları çözme tarzını ve akıl yürütme süreçlerini kullanıcıya göstererek, daha fazla veriye ihtiyaç duymadan kendi kendini geliştirme kapasitesine sahip. Bu özellik, yapay zekanın daha bağımsız ve verimli çalışmasını sağlıyor.
küresel arenada zirveye tırmanıyor
DeepSeek’in R1 akıl yürütme modeli, California Üniversitesi tarafından yapılan değerlendirmelerde büyük beğeni topladı. Chatbot Arena'da, Google'ın Gemini ailesi ve OpenAI'ın o1 modelinin ardından üçüncü sırada yer aldı. Aynı zamanda, Apple uygulama mağazasında, OpenAI'ın ChatGPT sohbet robotunu geride bırakarak en çok indirilen ücretsiz uygulama oldu.