Çin'in Deepseek'in maliyet kısmında bizim kadar iyi olabileceğimiz kadar iyi olabilir | Bilim, İklim ve Teknik Haberler
Şimdiye kadar yapılan sınırlı sayıda karşılaştırmaya dayanarak, Deepseek'in AI modelleri, AI'nın sözde Titanlarından Openai, Antropik ve Google gibi en iyi tekliflerden daha hızlı, daha küçük ve çok daha ucuz görünüyor.
Ve işte vurucu Çinli Teklif aynı derecede iyi görünüyor. Peki bunu nasıl yaptılar?
Birincisi, Deepseek'in mühendisleri ne olduğunu düşündüler. AI Yapabilecekleri yerine yapması gerekiyor.
Bir soruya olası her cevabı çözmeniz gerekmez, sadece en iyisini – örneğin 20 yerine iki ondalık basamak.
Modelleri hala büyük bilgisayar programları, Deepseek-V3'ün 671 milyar değişken var.
Ancak Chatgpt-4 devasa bir 1.76 trilyon.
Daha azıyla daha fazlasını yapmak, “uzmanların karışımı” adı verilen bir teknik kullanan modelin mimarisine bağlı gibi görünüyor.
Nerede OpenaiEn son model GPT-4.0 Einstein, Shakespeare ve Picasso olmaya çalışır, Deepseek'in daha çok uzman departmanlarına ayrılmış bir üniversiteye benziyor.
Bu, AI'nın ne tür bir sorgu sorulduğuna karar vermesini ve ardından dijital beyninin belirli bir kısmına ele alınması için göndermesini sağlar.
Bu, diğer parçaların kapalı kalmasını sağlar, zaman, enerji ve en önemlisi bilgi işlem gücü ihtiyacından tasarruf sağlar.
Ve büyük AI geliştiricilerini ve finansal piyasaları şok eden önemli ölçüde daha az bilgi işlem gücüne sahip eşdeğer performans.
En son teknoloji ürünü AI modelleri, gittikçe daha güçlü grafik işleme birimleri (GPU) kullanılarak geliştirilmiştir. Nvidia ABD'de.
Devamını oku:
AI artık Kaliforniya Tech Bros arasında yarışmıyor
Deepseek 'uyandırma çağrısı' bizim için, diyor Trump
Onları iyileştirmenin tek yolu, piyasa mantığı gittikçe daha fazla “hesaplama” idi.
Kısmen AI silah yarışında Çin'in önünde kalmak için ABD, en güçlü GPU'ların Çin'e satışını kısıtladı.
Deepseek'in mühendislerinin gösterdiği şey, mühendislerin bir sorun sunduğunuzda yaptıklarıdır. Bir çözüm bulurlar.
Openai ve diğerlerinin yaptıklarından öğrendikten sonra, bir modeli sıfırdan yeniden tasarladılar, böylece Superintelligence olmayan bilgisayar oyunları için tasarlanmış GPU'lar üzerinde çalışabilir.
Dahası, modelleri açık kaynaktır, yani geliştiricilerin ürünlerine dahil edilmesi daha kolay olacaktır.
Çok daha verimli olmak ve açık kaynak olmak, Deepseek'in yaklaşımını günlük AI uygulamaları için çok daha çekici bir teklif gibi gösteriyor.
Sonuç, elbette, neredeyse 600 milyar dolarlık bir gece saç kesimi Nvidia için.
Ama servetlerde ani tersine dönecek. Openai tarafından öncülük edilen ve şimdi Deepseek tarafından geliştirilen LLM tipi (büyük dil modeli) modelleri AI gelişiminde hepsi ve son değil.
Bir yapay zekadan “genel zeka” hala bir yoldur – ve bizi oraya götürmek için birçok üst düzey bilgi işlem gerekecektir.
Openai gibi firmaların kaderi daha az kesindir. Sözde oyun değiştiren GPT-5 modelleri, akıllara durgunluk veren miktarda bilgi işlem gücü gerektiren işlev görüyor.
Şimdi oyun etraflarında değişmiş gibi görünüyor ve birçoğu AI yatırımlarına ne getireceklerini merak ediyor.
