DeepSeek, tek GPU ile çalışabilen yeni modelini tanıttı

DeepSeek, Yeni Yapay Zeka Modeli DeepSeek-R1-0528-Qwen3-8B’yi Tanıttı

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynak kullanarak yüksek performans sağlayan yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi duyurdu. Bu model, sadece tek bir GPU üzerinde çalışabiliyor ve diğer modellere kıyasla önemli avantajlar sunuyor.

DeepSeek’in yeni modeli, temelini Alibaba’nın Mayıs 2025’te tanıttığı Qwen3-8B modelinden almıştır. Laboratuvar, büyük R1 modelinden elde ettiği verilerle bu küçük versiyonu eğitmeyi başardı. Bu yöntemle geliştirilen model, Google’ın Gemini 2.5 Flash modelini içeren zorlu matematik testlerinden biri olan AIME 2025’te başarılı oldu. Ayrıca Microsoft’un Phi 4 Reasoning Plus modeline, HMMT sınavında da oldukça yakın bir performans sergiledi.

Küçük yapay zeka modelleri genellikle sınırlı becerilere sahip olsa da, DeepSeek-R1-0528-Qwen3-8B’nin dikkat çekici yanı düşük donanım gereksinimidir. NodeShift’in verilerine göre, bu model 40 ila 80 GB RAM’e sahip tek bir Nvidia H100 GPU ile çalışabiliyor. Oysa tam boyutlu R1 modeli, yaklaşık 12 adet 80 GB’lık GPU gerektiriyor.

Model, MIT lisansı ile ticari kullanıma sunulmuştur ve Hugging Face ve LM Studio gibi platformlardan erişilebilir durumdadır. Bu yapay zeka modeli, akademik ve endüstriyel alanda kullanım için tasarlanmıştır.

Related Posts

Dark Web ABD şirketlerine tebelleş oldu

Siber dünyanın görünmeyen yüzü olarak bilinen dark web, ABD’li şirketler için giderek büyüyen bir tehdit haline geliyor. Küresel çapta siber güvenlik risklerini analiz eden bir tehdit istihbarat şirketi olan SOCRadar’ın son raporu, siber saldırıların …

Elon Musk’ın yeni yapay zeka aracı, erkek fantezilerine mi hitap ediyor?

Elon Musk, yapay zeka aracı Grok Imagine’ı erkek fantezilerine yönelik cinselleştirilmiş kadın görüntüleriyle dolduruyor. xAI’ın bu stratejisi, teknoloji dünyasında tartışma yaratıyor.

NASA’dan yeni güncelleme: Güneş Sistemi’ne giren gizemli cisim hızla yaklaşıyor

NASA, güneş sistemimize hızla giren ve merakla takip edilen yıldızlararası cisim 3I/ATLAS hakkında çarpıcı bir güncelleme paylaştı. İlk kez 1 Temmuz’da, Güneş’ten 420 milyon mil (675 milyon kilometre) uzaklıkta gözlemlenen bu cisim, şu an güneş sistemimizin iç bölgelerine doğru ilerliyor.

Çin’li BYD dünyayı kasıp kavuracak! Yeni model Track Edition’ın özellikleri belli oldu

Elektrikli otomobilleri ile piyasada kendine geniş yer bulan BYD, 3.019 beygir gücündeki Yangwang U9 “Track Edition” modelinin özellikleri belli oldu.

Kafanıza göktaşı düşmesi mi, bir filin saldırısı mı? Hangisinin ihtimali daha yüksek?

Yeni bir araştırma, büyük bir göktaşının Dünya’ya çarpma olasılığının, insan ömrü içinde yıldırım çarpmasından biraz daha yüksek olduğunu ortaya koydu. Ama durun, dahası da var…

Depremi 30 saniye önceden bildirdi: Bildirimleri açmak için bu adımları hemen uygulayın

Dün akşam saatlerinde gerçekleşen Balıkesir merkezli deprem Ege ve Marmara Bölgesi’nin büyük bölümünde hissedildi. Google deprem uyarı sisteminin birçok vatandaşı yaklaşık 30 saniye önceden uyarması deprem sonrasında en çok konuşulan konulardan oldu. Deprem uyarısı alamayan vatandaşlar ise Google’ın deprem uyarı sistemini nasıl açacağını araştırmaya başladı.