DeepSeek V4 Huawei Ascend Çipleriyle Eğitimini Tamamladı


DeepSeek V4 Pro, eğitim süreçlerinde Nvidia yerine Huawei Ascend çiplerini kullanarak Çin’in yapay zeka sektöründe yerli donanım bağımsızlığına doğru büyük bir adım attı.

Çin merkezli yapay zeka girişimi DeepSeek, geliştirdiği yeni nesil DeepSeek V4 Pro modelinin eğitim süreçlerinde Nvidia veya AMD yerine yerli Huawei Ascend çiplerini tercih ederek sektörde önemli bir dönüm noktasına imza attı. Shenzhen merkezli kurumların iş birliğiyle yürütülen projede, yaklaşık 1000 adet Ascend 910C çipi kullanılarak modelin постобучение (post-training) süreci başarıyla tamamlandı. Bu gelişme, ABD merkezli gelişmiş çip tedarik kısıtlamalarıyla mücadele eden Çin yapay zeka endüstrisinin, dışa bağımlılığı azaltma yolunda attığı stratejik bir adım olarak değerlendiriliyor. Daha önce DeepSeek V3 modeli, 2048 adet Nvidia H800 çipi üzerinde eğitilmişti.

  • DeepSeek V4 Pro modelinin eğitim süreci, 1000 adet Huawei Ascend 910C çipiyle gerçekleştirildi.
  • Huawei, yerli donanımların yapay zeka eğitiminde kullanılabileceğini kanıtlayarak sektörel bir başarıya ulaştı.
  • Çinli teknoloji şirketleri, Nvidia ve AMD bağımlılığını azaltmak için yerli çiplerin kullanımını hızlandırıyor.

Huawei Ascend çiplerinin kullanımı, Çin’in kendi kendine yeten bir yapay zeka ekosistemi kurma hedefinde kritik bir eşik oluşturuyor.

Yapay Zeka Eğitiminde Yerli Donanımlar Öne Çıkıyor

Yapay zeka modellerinin geliştirilme süreci, genellikle verinin işlenmesi ve modelin talimatları anlama yeteneğinin kazandırıldığı iki temel aşamadan oluşur. Daha önce Çinli şirketler, özellikle karmaşık model eğitimi gerektiren süreçlerde Nvidia’nın yüksek performanslı donanımlarına mahkum kalıyordu.

Ancak DeepSeek V4 Pro ile atılan bu adım, Huawei’nin Ascend mimarisinin modern büyük dil modellerini (LLM) başarıyla eğitebilecek kapasiteye sahip olduğunu gösterdi.

Açık Kaynak Yapay Zeka, DeepSeek, Qwen, OpenAI, GPT-OSS

Projenin başarısı, Shenzhen Loop Area, Harbin Teknoloji Enstitüsü ve Shenzhen Büyük Veri Enstitüsü gibi akademik ve endüstriyel paydaşların kolektif çabasıyla mümkün kılındı.

Çip Pazarındaki Bağımlılık Azalmaya Başlıyor

Geçmişte DeepSeek V3 gibi modeller, geniş ölçekli Nvidia H800 sistemlerine dayalı olarak eğitilmişti. Fakat mevcut ihracat kısıtlamaları, bu tür gelişmiş donanımlara erişimi zorlaştırdı. DeepSeek’in bu hamlesi, sadece bir test değil, aynı zamanda operasyonel bir çözüm olarak öne çıkıyor. Huawei Ascend 910C çiplerinin sağladığı performans, Çinli geliştiricilerin artık Nvidia veya AMD’ye olan zorunlu bağımlılıktan kurtulabileceğine dair güçlü bir sinyal veriyor.

Yüksek maliyet avantajı sunan DeepSeek, yerli donanımlarla rekabet gücünü artırmayı planlıyor.

Yeni Nesil Modeller Yatırım Çekmeye Devam Ediyor

DeepSeek’in yapay zeka alanındaki hızlı yükselişi, yatırımcıların da dikkatini çekiyor. Şirketin yaklaşık 7,4 milyar dolar değerinde devasa bir finansman turuna hazırlandığı belirtiliyor. ChatGPT ve diğer küresel rakiplerine karşı daha düşük maliyetli ve yüksek performanslı çözümler sunmayı hedefleyen DeepSeek, metin üretimi ve kod yazma gibi alanlarda devrim yaratma potansiyeline sahip. Donanım tarafında ise Huawei ile kurulan bu stratejik ortaklık, şirketin uzun vadeli sürdürülebilirliğini güvence altına alıyor.



Haber Kaynak Linki

Related Posts

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir