OpenAI o1’i piyasaya sürdü

ChatGPT’nin yaratıcısı OpenAI, bir sonraki büyük ürün sürümünü duyurdu: Kod adı Strawberry olan ve resmi adı OpenAI o1 olan üretici yapay zeka modeli piyasada…

o1’i ChatGPT istemcisinde görmek için ChatGPT Plus veya Team abonesi olmak gerekiyor. Kurumsal ve eğitim kullanıcıları ise gelecek hafta başında erişim sağlayacaklar.

Şu an için o1’in sohbet botu deneyimi oldukça sade. Önceki modeli GPT-4o’nun aksine, o1 henüz web’de gezinme veya dosya analiz etme yeteneğine sahip değil. Modelin görsel analiz yapma kabiliyeti var, ancak ek testler yapılana kadar bu özellik devre dışı bırakıldı. Ayrıca, o1’in kullanım limiti var: Haftalık sınırlamalar şu an için o1-preview için 30 mesaj ve o1-mini için 50 mesajla sınırlı.

Bir diğer olumsuz tarafı ise o1’in oldukça pahalı olması: API’de o1-preview, 1 milyon giriş tokeni için 15 dolar ve 1 milyon çıkış tokeni için 60 dolar. Bu da giriş için GPT-4o’nun maliyetinin 3 katı ve çıkış için 4 katı anlamına geliyor.

OpenAI, o1-mini erişimini tüm ücretsiz ChatGPT kullanıcılarına sunmayı planladığını söylüyor, ancak henüz bir çıkış tarihi belirlemiş değil. Şirketin bu sözü yerine getirmesini bekleyeceğiz.

OpenAI’ya göre o1, yapay zeka modellerinin genellikle hata yaptığı mantıksal tuzaklardan kaçınıyor. Bunun nedeni, o1’in bir komut veya sorunun tüm bölümlerini daha fazla düşünerek etkili bir şekilde kendi kendini kontrol edebilmesi.

OpenAI’ya göre, şirketin iç projesi Q*’dan doğan o1, özellikle matematik ve programlama ile ilgili zorlukları çözmede yetenekli. Ancak metin tabanlı o1’in diğer üretici yapay zeka modellerinden “niteliksel” olarak farklı hissettirmesinin nedeni, sorulara yanıt vermeden önce “düşünme” yeteneği.

Ekstra düşünme süresi verildiğinde, o1 bir görevi bütünsel bir şekilde ele alabiliyor. Bir dizi eylemi önceden planlayarak ve bunları uzun bir süre boyunca gerçekleştirerek sonuca ulaşmasını sağlayacak eylemler gerçekleştiriyor.

OpinAI uzmanları bu yenilikler için şu bilgileri veriyor: o1, takviye öğrenmesi ile eğitildi. Bu sistem ödüller ve cezalar aracılığıyla öğrenir. “Yanıt vermeden önce özel bir düşünce zinciri üzerinden ‘düşünmesi’ sağlandı…” OpenAI’nın yeni bir optimizasyon algoritması ve bilimsel literatür de içeren “mantıksal veri” ile spesifik olarak modeller için uyarlanmış bir eğitim veri seti kullanıldığı dile getiriliyor. “o1 ne kadar uzun düşünürse, mantıksal görevlerde o kadar iyi olur…

Uluslararası Matematik Olimpiyatı’na giriş sınavında, o1 soruların yüzde 83’ünü doğru çözerken, GPT-4o yalnızca yüzde 13’ünü çözmüş. Model Codeforces yarışmaları olarak bilinen çevrimiçi programlama yarışmalarında katılımcıların yüzde 89′.’luk diliminde diliminde yer aldığını iddia ediliyor.

Genel olarak, OpenAI o1’in veri analizi, bilim ve kodlama ile ilgili problemlerde daha iyi performans göstermesi gerektiğini söylüyor. Ayrıca, en azından OpenAI’nin testlerine göre, o1 çok dillilik yeteneklerinde (özellikle Arapça ve Korece gibi dillerde) GPT-4o’ya göre ilerleme kaydediyor.

Ancak bir dezavantaj var. Sorguya bağlı olarak o1 diğer modellere göre daha yavaş olabilir; Uzmanlar, bazı soruları yanıtlamasının on saniyeden fazla sürebileceğini söylüyor.

Üretici yapay zeka modellerinin öngörülemez doğası göz önüne alındığında, o1’in başka kusurları ve sınırlamaları da olabilir… OpenAI’nin yayınladığı teknik makalede, o1-preview ve o1-mini’nin GPT-4o ve GPT-4o-mini’den daha fazla halüsinasyon görmeye — yani kendinden emin bir şekilde yanlış bilgiler üretmeye — meyilli olduğunu ve o1’in sorunun cevabını bilmediği durumlarda bunu daha az kabul ettiğine dair anekdotsal geri bildirimler aldığını söylüyor.

OpenAI, o1 ile ilk sırada yer alabilir. Ancak rakiplerin kısa sürede benzer modellerle piyasaya çıkacaklarını varsayarsak, şirketin gerçek sınavı o1’i geniş kitlelere sunmak olacak.

O noktadan sonra, OpenAI’nin o1’in geliştirilmiş sürümlerini ne kadar hızlı sunabildiğini göreceğiz. Şirket, o1 modelleriyle saatler, günler veya hatta haftalar boyunca düşünen deneyler yapmayı planladığını ve böylece mantıksal yeteneklerini daha da geliştirmeyi amaçladığını söylüyor.