HABER MERKEZİ
Üretken yapay zekanın ne olduğunu ve nasıl çalıştığını anlatma çabaları, çeşitli benzetmeler ve karşılaştırmalar ortaya çıkarmıştır. 'Kara kutu' tanımlamasından başlayarak 'steroidli otomatik tamamlama', 'papağan' benzetmesi ve hatta 'spor ayakkabı' karşılaştırmasına kadar, bu metaforların ortak amacı karmaşık bir teknolojiyi herkesin anlayabileceği günlük deneyimlere bağlamaktır. Ancak bu benzetmelerin çoğu, orijinal teknolojinin gerçek işleyişini aşırı derecede basitleştirerek veya yanıltıcı bir şekilde sunarak, tam bir anlayış yerine kısmi bir kavrayış sağlamaktadır.
Son zamanlarda giderek yaygınlaşan bir analoji, üretken yapay zekayı 'kelimeler için bir hesap makinesi' olarak tanımlamaktadır. Bu karşılaştırma, kısmen OpenAI'nin genel müdürü Sam Altman tarafından popülerleştirilmiştir. Hesap makinesi benzetmesi, tıpkı matematik dersinde sayıları işlemek için kullandığımız tanıdık plastik nesneler gibi, yapay zeka araçlarının amacının büyük miktarda dilsel veriyi işlememize yardımcı olmak olduğunu öne sürmektedir. Bu açıklamaya göre, yapay zeka da hesap makinesi gibi, kendisine verilen girdileri belirli kurallar çerçevesinde işleyerek çıktı üretmektedir.
Ancak hesap makinesi analojisi haklı olarak eleştirilmiştir, çünkü yapay zekanın daha rahatsız edici ve karmaşık yönlerini gizleyebilmektedir. Sohbet robotlarının aksine, hesap makinelerinin yerleşik önyargıları yoktur, matematiksel hata yapmazlar ve temel etik ikilemler oluşturmazlar. Bu nedenle, yapay zeka araçlarının sadece hesap makinesi olarak tanımlanması, onların gerçek sorunlarını ve potansiyel risklerini göz ardı etmektedir.
Öte yandan, bu analojiyi tamamen reddetmek de tehlikeli bir yaklaşımdır, çünkü özünde yapay zeka araçları gerçekten de kelime hesap makineleridir. Ancak burada önemli olan nokta, hesap makinenin kendisi değil, hesaplama pratiğidir. Yapay zeka araçlarındaki hesaplamalar, günlük insan dil kullanımının temelini oluşturan hesaplamaları taklit edecek şekilde tasarlanmıştır. Bu da yapay zekanın neden bu kadar insan gibi hissettirildiğinin anahtarıdır.
Çoğu dil kullanıcısı, günlük iletişimlerinin ne ölçüde istatistiksel hesaplamaların ürünü olduğunun yalnızca dolaylı olarak farkındadır. Örneğin, birinin 'biber ve tuz' yerine 'tuz ve biber' demesini duymanın yarattığı rahatsızlığı düşünün. Ya da bir kafede 'güçlü çay' yerine 'kuvvetli çay' sipariş etseniz alacağınız tuhaf bakışı. Bu tür tepkiler, aslında bizim dilsel tercihlerimizin ne kadar istatistiksel temellere dayandığını göstermektedir.
Kelimeleri seçme ve sıralama şeklimizi ve dildeki diğer birçok diziyi yöneten kurallar, onlarla olan sosyal karşılaşmalarımızın sıklığından kaynaklanmaktadır. Bir şeyi belirli bir şekilde ne kadar sık duyarsanız, herhangi bir alternatif o kadar az uygulanabilir gelecektir. Ya da daha doğrusu, hesaplanmış başka herhangi bir dizi o kadar az makul görünecektir. Bu, bilinçsiz bir şekilde de olsa, beynimizin istatistiksel örüntü tanıma sistemleri gibi çalıştığını göstermektedir.
Dilbilimde, dilin incelenmesine adanmış geniş alanda, bu diziler 'eşdizimler' olarak bilinmektedir. Eşdizimler, insanların çok kelimeli kalıpları 'doğru hissettirip hissettirmediklerine' – uygun, doğal ve insani gelip gelmediklerine – göre nasıl hesapladıklarını gösteren birçok olgudan sadece biridir. Örneğin, 'güçlü çay' ifadesi 'kuvvetli çay'dan daha doğal hissettirdiği için, bu eşdizim daha sık kullanılmaktadır. Bu tercihler, tamamen bilinçli dilbilimsel kurallardan ziyade, istatistiksel alışkanlıkların sonucudur.
İnsanlar, dili öğrenirken ve kullanırken, bu eşdizim örüntülerini bilinçsiz bir şekilde öğrenmektedir. Çocuklar, belirli kelime kombinasyonlarını ne kadar sık duydukları temelinde, hangi kombinasyonların 'doğru' olduğunu belirlemektedir. Bu öğrenme süreci, yapay zeka modellerinin dil öğrenme süreciyle şaşırtıcı derecede benzerdir. Her iki durumda da, istatistiksel örüntü tanıma, dil kullanımının temelini oluşturmaktadır.
Büyük dil modellerinin (LLM'ler) – ve dolayısıyla sohbet robotlarının – temel başarılarından biri, bu 'doğru hissettirme' faktörünü artık insan sezgisini başarıyla aldatan şekillerde resmileştirmeyi başarmış olmalarıdır. Aslında, dünyadaki en güçlü eşdizim sistemlerinden bazılarıdır. Bu modeller, anlamlarını ve ilişkilerini haritalayan soyut bir uzay içinde belirteçler (ister kelimeler, semboller veya renk noktaları olsun) arasındaki istatistiksel bağımlılıkları hesaplayarak, yapay zeka bu noktada yalnızca Turing testinde insan olarak geçmekle kalmayan, belki de daha rahatsız edici bir şekilde, kullanıcıların onlara aşık olmalarını sağlayabilen diziler üretmektedir.
Bu gelişmelerin mümkün olmasının önemli bir nedeni, teknolojinin gelişim anlatısında genellikle gömülü olan yapay zekanın dilbilimsel kökleriyle ilgilidir. Yapay zeka araçları, bilgisayar biliminin bir ürünü olduğu kadar dilbilimin farklı dallarının da bir ürünüdür. GPT-5 ve Gemini gibi çağdaş LLM'lerin ataları, Rusça'yı İngilizce'ye çevirmek için tasarlanmış Soğuk Savaş dönemi makine çeviri araçlarıdır. Ancak Noam Chomsky gibi figürler altında dilbilimin gelişmesiyle, bu tür makinelerin amacı basit çeviriden doğal (yani insan) dil işlemenin ilkelerini çözmeye doğru kaymıştır.
LLM geliştirme süreci aşamalar halinde gerçekleşmiştir. İlk olarak, dillerin 'kurallarını' (gramer gibi) mekanize etme girişimleriyle başlanmıştır. Daha sonra, sınırlı veri setlerine dayalı kelime dizilerinin sıklıklarını ölçen istatistiksel yaklaşımlar geliştirilmiştir. Son olarak, akıcı dil üretmek için sinir ağları kullanan mevcut modellere ulaşılmıştır. Ancak olasılıkları hesaplamanın altında yatan pratik aynı kalmıştır. Ölçek ve biçim ölçülemez şekilde değişmiş olsa da, çağdaş yapay zeka araçları hala istatistiksel örüntü tanıma sistemleridir.
Peki neden bu gerçeği kolayca tanımıyoruz? Bunun önemli bir nedeni, şirketlerin yapay zeka araçlarının pratiklerini tanımlama ve adlandırma şekliyle ilgilidir. 'Hesaplama' yerine, yapay zeka araçları 'düşünüyor', 'akıl yürütüyor', 'arama yapıyor' veya hatta 'rüya görüyor' diye tanımlanmaktadır. Bu dil seçimleri, bilinçli veya bilinçsiz bir şekilde, yapay zekanın insan benzeri yeteneklere sahip olduğu izlenimini yaratmaktadır.
İma edilen şey, insanların dil kalıplarını nasıl kullandığına dair denklemi çözmede, yapay zekanın dil aracılığıyla ilettiğimiz değerlere erişim kazandığıdır. Başka bir deyişle, yapay zeka sadece kelime kombinasyonlarını tahmin etmekle kalmayıp, aynı zamanda bu kelimelerin arkasındaki anlamı ve niyeti de anladığı izlenimi verilmektedir. Ancak en azından şimdilik, yapay zeka bu tür bir anlayışa sahip değildir. Yapay zeka, sadece istatistiksel örüntüleri tanıyarak, bu örüntülere dayalı olarak en olası sonraki kelimeyi tahmin etmektedir.
Sonuç olarak, yapay zekanın insan gibi hissettirilmesinin sırrı, onun gerçekten insan gibi düşündüğünde değil, insan dilinin kendisinin istatistiksel bir sistem olmasında yatmaktadır. Yapay zeka, bu istatistiksel sistemi o kadar başarıyla taklit etmektedir ki, biz de onun insan gibi düşündüğünü sanmaktayız. Ancak gerçekte, yapay zeka her zaman sadece hesaplama yapıyor, ve bu hesaplamalar, dillerin içinde gömülü olan gizli istatistiksel örüntüleri taklit etmektedir.