Meta, ortalama 100 dili çeviri edebilen SeamlessM4T AI modelini piyasaya sürdü

0
Resim, Meta Çeviriyi tasvir eden bir illüstrasyondur.  —Meta/Dosya
Fotoğraf, Meta Çeviriyi tasvir eden bir illüstrasyondur. —Meta/Dosya

Feysbuk’un ana şirketi Meta, birçok dildeki konuşmaları çeviri edebilen ve yazıya dökebilen bir suni zeka modelini piyasaya sürdüğünden, artık çeviride hiçbir şey kaybolmayacaktır; bu, dil engellerini aşarak gerçek zamanlı iletişimi mümkün kılan ürünler için ihtimaller içinde bir temel taşı görevi görecektir.

İşletme, bir blog yazısında, SeamlessM4T modelinin, ortalama 100 dilde metin ve konuşma içinde tercüme sağlamanın yanı sıra 35 dilde tam konuşmadan konuşmaya tercüme sağlamak suretiyle daha ilkin yalnızca ayrı modellerde erişilebilen teknolojiyi birleştirebileceğini iddia etti.

CEO Mark Zuckerberg’e bakılırsa bu teknolojiler, dünyanın her yerinden kullananların, firmanın geleceğini belirlediği, birbirine bağlı sanal dünyalardan oluşan bir koleksiyon olan meta veri ortamında kontakt kurmasına destek olacak.

Blog yazısında, Meta’nın modeli ticari olmayan kullanım için kamuya açık hale getirmiş olduğu açıklandı.

Meta, bu yıl, Google ve Microsoft’un sponsor olduğu OpenAI tarafınca sağlanan hususi modellerle direkt rekabet eden Llama adlı oldukça büyük bir dil modeli de dahil olmak suretiyle, ilk olarak parasız AI modellerinden oluşan bir telaş yayınladı.

Zuckerberg, Meta’nın açık bir suni zeka ekosisteminden faydalandığını, bu sebeple modellere erişim için ücret almak yerine, toplumsal platformları için kullanıcıya yönelik araçların geliştirilmesinde kitle kaynak kullanımından daha çok kazanç elde edeceğini iddia ediyor.

Sadece modellerini oluşturmak için kullanılan eğitim verileri sebebiyle Meta, sektörün geri kalanıyla aynı yasal sorunlarla karşı karşıya.

Güldürmen Sarah Silverman ve öteki iki yazar, Temmuz ayında Meta ve OpenAI’ye karşı oluşturulan bir şikayette, şirketlerin çalışmalarını kendi rızaları olmadan eğitim verileri olarak kullandıklarını iddia etmişti.

Bir araştırma yayınında Meta araştırmacıları, söz mevzusu veri deposunu tanımlamadan, 4 milyon saatlik “taranmış web verilerinin halka açık bir deposundan meydana gelen ham ses” kullanarak SeamlessM4T modeli için ses eğitim verileri topladıklarını iddia etti.

Bir Meta sözcüsü, ses verilerinin kaynağına ilişkin sorulara cevap vermedi.

Araştırma makalesine bakılırsa metin verileri, Wikipedia ve ilgili web sitelerinden alınan içerikleri içeren, geçen yıl oluşturulan veri kümelerinden elde edildi.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir