Yapay zekâ alanındaki önde gelen şirketler, tüketiciler ve işletmeler için daha uygun maliyetli yapay zekâ modelleri geliştirmek amacıyla “distilasyon” adı verilen bir sürece yöneliyor. OpenAI, Microsoft ve Meta gibi teknoloji devleri, bu yöntemi küresel yapay zekâ yarışında rekabet avantajı sağlamak için kullanıyor.
Bu teknik, Çin merkezli DeepSeek’in açık kaynaklı sistemleri kullanarak güçlü ve verimli yapay zekâ modelleri geliştirmesiyle büyük yankı uyandırdı. Şirket, Meta ve Alibaba gibi rakiplerinin yayınladığı açık kaynak modelleri temel alarak yapay zekâ sistemleri oluşturdu. Bu gelişme, Silicon Valley’nin yapay zekâ liderliğine duyulan güveni sarsarken, ABD’li teknoloji devlerinin hisse senetlerinden milyarlarca dolarlık değer kaybına yol açtı.
Distilasyon Nedir ve Nasıl Çalışır?
Distilasyon süreci, büyük bir dil modelinin (öğretmen model) kelime tahmini yaparak ürettiği veriyi kullanarak daha küçük bir “öğrenci” modelin eğitilmesini sağlar. Bu yöntem, büyük modelin bilgi ve tahmin yeteneklerinin hızla daha küçük modele aktarılmasına olanak tanır.
Bu teknik yıllardır kullanılıyor olsa da son dönemdeki ilerlemeler, start-up’ların daha düşük maliyetle uygulama geliştirmesi için büyük bir fırsat sunduğunu gösteriyor.
OpenAI’nin platform başkanı Olivier Godement, distilasyonun gücünü şu sözlerle vurguluyor:
“Distilasyon gerçekten büyüleyici bir süreç. Büyük ve akıllı bir modeli kullanarak, onu belirli görevlerde son derece yetenekli, çalıştırılması çok ucuz ve çok hızlı bir küçük model oluşturmak için eğitiyoruz.”
OpenAI’nin GPT-4’ü, Google’ın Gemini’si ve Meta’nın Llama’sı gibi büyük dil modelleri, geliştirilmesi ve çalıştırılması için devasa veri setlerine ve muazzam işlem gücüne ihtiyaç duyuyor. Bu modellerin eğitimi için kesin rakamlar açıklanmamış olsa da maliyetin yüz milyonlarca dolar olduğu tahmin ediliyor.
Ancak distilasyon sayesinde, geliştiriciler ve şirketler bu güçlü modellerin yeteneklerine çok daha düşük maliyetlerle erişebiliyor. Böylece, yapay zekâ modelleri doğrudan dizüstü bilgisayarlar ve akıllı telefonlar gibi cihazlarda çalıştırılabiliyor.