Açık Kaynak Yapay Zeka da Neyin Nesi?

Onlarca yıldır yazılım çevrelerinde süregelen açık kaynak kapalı kod gerilimi, yapay zeka alanına da kaydı. Kimse yapay zeka bağlamında “açık kaynak” kavramının ne anlama geldiği konusunda uzlaşamıyor.

Açık Kaynak İnisiyatifi (OSI), 25 yıldan fazla zamandır Açık Kaynak Tanımının (OSD) koruyucusu olarak, “açık kaynak” teriminin yazılımda nasıl uygulanabileceğini belirliyor. Bu tanıma uygun bir lisans, meşru olarak “açık kaynak” olarak kabul edilebiliyor. Tamamen serbestten nispeten daha az serbese kadar geniş bir lisans yelpazesini tanıyor.

Ancak eski lisanslama ve adlandırma uzlaşmalarını yazılımdan yapay zekaya aktarmak sorun çıkarıyor. Açık kaynak uzmanları “açık kaynak yapay zeka” diye bir şey olmadığını belirtiyor. Açık kaynak, yazılım kaynak kodu için icat edilmiş. Yapay zeka dünyasında ağırlıklar (neural network weights) olarak adlandırılan ve ağın eğitim sürecinde öğrendiği parametrelerin yazılım kaynak kodu ile anlamlı bir şekilde karşılaştırılamıyor. Çünkü “ağ ağırlıkları, yazılım kaynak kodu değil; insanlar tarafından okunamaz ve hataları giderilemez”. Ayrıca, açık kaynağın temel hakları, ağ ağırlıklarına uyarlanamaz.

1998 yılında kurulan OSI, açık kaynakla ilgili savunuculuk, eğitim ve temel amacı olan Açık Kaynak Tanımı etrafında birçok faaliyet yürüten kâr amacı gütmeyen bir kamu yararı kuruluşudur. Bugün, Amazon, Google, Microsoft, Cisco, Intel, Salesforce ve Meta gibi saygın üyelerden sponsorluklarla finanse ediliyor.

Meta’nın OSI ile ilişkisi, “açık kaynak yapay zeka” kavramıyla ilgili olarak şu anda özellikle dikkat çekici. Meta, yapay zekasını açık kaynak adı altında sunmasına rağmen, Llama modellerinin nasıl kullanılabileceği konusunda belirgin kısıtlamalara sahip: Araştırma ve ticari kullanım durumları için ücretsiz olarak kullanılabilseler de, aylık 700 milyon kullanıcıdan fazla kullanıcıya sahip uygulama geliştiricilerinin Meta’dan özel bir lisans talep etmeleri gerekiyor. Bu lisans Meta’nın tamamen kendi takdirine bağlı.

Meta’nın büyük dil modelleri (LLM) ile ilgili dili oldukça esnek. Şirket, Llama 2 modelini açık kaynak olarak adlandırmışken, Nisan ayında Llama 3’ün piyasaya sürülmesiyle terminolojiden biraz geri adım attı ve “açıkça mevcut” ve “açıkça erişilebilir” gibi ifadeler kullanmaya başladı. Ancak bazı yerlerde hala modeli “açık kaynak” olarak adlandırmaktadır.

Neleri kapsıyor?

Mevcut Açık Kaynak Yapay Zeka Tanımı taslağı, belgenin kapsamını belirten “önsöz”; Açık Kaynak Yapay Zeka Tanımı’nın kendisi ve açık kaynak uyumlu bir yapay zeka sistemi için gerekli bileşenleri içeren bir kontrol listesi olmak üzere üç ana kısımdan oluşuyor.

Mevcut taslağa göre, bir Açık Kaynak Yapay Zeka sistemi, herhangi bir amaçla sistemi kullanma izni aramadan kullanma özgürlüğü; sistemin nasıl çalıştığını inceleme ve bileşenlerini inceleme özgürlüğü; ve sistemi herhangi bir amaçla değiştirme ve paylaşma özgürlüğü tanımalı.

Ancak en büyük zorluklardan biri veriyle ilgili. Yani, bir şirket eğitim veri setini başkalarının incelemesi için kullanılabilir hale getirmediyse bir yapay zeka sistemi “açık kaynak” olarak sınıflandırılabilir mi? Uzmanlara göre, verinin nereden geldiğini ve bir geliştiricinin veriyi nasıl etiketlediği, çoğalttığı ve filtrelediği bilgisini bilmek daha önemli. Ayrıca, veri kümesinin çeşitli kaynaklarından nasıl toplandığını gösteren kodun erişimine sahip olmak da önemli. Bu bilgiyi bilmek, ham veri setine sahip olmaktan çok daha iyi.

Tam veri kümesine erişim sağlamak hoş olsa da (OSI bunu “isteğe bağlı” bir bileşen olarak tanımlıyor), uzmanlar bunun birçok durumda mümkün veya pratik olmadığını belirtiyor. Bunun nedeni, veri kümesinde geliştiricinin yeniden dağıtma iznine sahip olmadığı gizli veya telif hakkıyla korunan bilgilerin bulunması olabilir. Ayrıca, verinin sistemle aslında paylaşılmadığı federated learning, differential privacy ve homomorphic encryption gibi tekniklerle makine öğrenimi modellerini eğitme yöntemleri de var.

Farklar neler?

Ve bu, “açık kaynak yazılım” ile “açık kaynak yapay zeka” arasındaki temel farkları mükemmel bir şekilde vurgular: Niyetler benzer olabilir, ancak aynı şekilde karşılaştırılamazlar ve OSI’nin tanımında yakalamaya çalıştığı bu uyumsuzluk.

Yazılımda, kaynak kod ve ikili kod aynı eserin iki görünümüdür: Aynı programı farklı biçimlerde yansıtırlar. Ancak eğitim veri kümeleri ve sonrasında eğitilmiş modeller farklı şeylerdir: Aynı veri kümesini alabilirsiniz ve aynı modeli tutarlı bir şekilde yeniden oluşturamayabilirsiniz. Eğitim sırasında gerçekleşen çeşitli istatistiksel ve rastgele mantıklar vardır ki bu, yazılım gibi tekrarlanabilir olmasını sağlayamaz.

Bu nedenle, bir açık kaynak yapay zeka sistemi, açık talimatlarla kolayca yeniden üretilebilir olmalı. Ve bu, Açık Kaynak Yapay Zeka Tanımı’nın kontrol listesi yönünün devreye girdiği nokta…