Yapay zekâda yarış kızıştı
DeepSeek Mobil Uygulaması, ABD’de Lider Oldu!
İsmail Şahin / İSTANBUL – Çin merkezli yapay zekâ girişimi DeepSeek, ABD’de OpenAI’ın sohbet robotu ChatGPT’yi geride bırakarak App Store’da en çok indirilen uygulama haline geldi.
DeepSeek, Mixture of Experts (MOE) mimarisini kullanarak açık kaynaklı büyük dil modelleri geliştiriyor. Geçtiğimiz hafta 671 milyar parametreye sahip R1 modelinin açık kaynak versiyonunu yayınlayan girişim, Silikon Vadisi’nin dikkatini çekti. DeepSeek araştırmacıları tarafından yayınlanan bir makalede, mobil uygulamaya güç veren DeepSeek-V3 modelinin eğitiminde Nvidia’nın H800 çiplerinin kullanıldığı ve bunun şirkete 5.6 milyon dolara mal olduğu belirtildi.
Açık Kaynak ve Ücretsiz!
ABD’li şirketler, yapay zekâ modellerini eğitmek için büyük paralar harcarken, DeepSeek’in 5.6 milyon dolar maliyetle 671 milyar parametreye sahip bir model geliştirmesi, teknoloji ihracat kontrollerinin etkinliğini sorgulatmaya başladı. Üstelik, DeepSeek-R1 büyük ölçüde açık kaynaklı olarak yayınlandı.
R1’in Başarısının Sırrı
DeepSeek’in başarısı, ABD’nin son teknoloji çiplere uyguladığı kısıtlamalar göz önüne alındığında daha da dikkat çekici hale geliyor. DeepSeek çalışanı Zihan Wang, Çin’in yenilikçi yöntemlere başvurmak zorunda kaldığını belirtiyor. Şirket, Nvidia’nın Çin pazarı için sunduğu çiplerin performans eksikliğini telafi etmek için eğitim sürecini yeniden düzenledi. Bu sayede, ABD ihracat kontrolleri, geliştiricileri daha akıllı ve enerji verimli algoritmalar oluşturmaya zorladı.
DeepSeek R1, matematik ve kodlama alanında karmaşık problemleri çözme yeteneğiyle öne çıkıyor. Model, adım adım sorguları işleyerek sorunlara çözüm buluyor.
Dehanın Ardındaki İsim: Liang Wenfeng
Hangzhou merkezli şirket, bilgi ve elektronik mühendisliği alanında geçmişi olan Zhejiang Üniversitesi mezunu Liang Wenfeng tarafından Temmuz 2023’te kuruldu. Şirket, yapay genel zeka seviyesine ulaşmayı hedefleyen Liang liderliğinde farklı projeler üzerinde çalışıyor.
‘ABD’yle Savaş Açan Çin: DeepSeek’
Yapay zeka uzmanı gazeteci ve yazar Şule Güner’e göre, DeepSeek’in açık kaynaklı muhakeme kapasitesine sahip R-1 modeli, ABD-Çin arasındaki yapay zeka rekabetini net bir şekilde ortaya koyuyor. DeepSeek’in yükselişi, özellikle veri eğitiminde sağladığı avantajlarla dikkat çekiyor. Ayrıca, DeepSeek R-1’ın o1 modelinden daha az sayıda GPU’ya ihtiyaç duyması önemli bir fark olarak öne çıkıyor.
‘Türkçe’de Etkili Çalışıyor’
CBOT kurucu ortaklarından Mete Aktaş, DeepSeek’in uzun süredir yapay zekâ alanında başarılı çalışmalar yürüttüğünü ve ChatGPT’ye güçlü bir alternatif oluşturduğunu belirtti. Aktaş, DeepSeek’in R1 modelinin Türkçe dilinde de başarılı sonuçlar verdiğini vurgulayarak, Türkçe’ye özel olarak geliştirilmiş bir dil modelinin oluşturulabileceğini ifade etti.