Nasıl düşünüyoruz? Araştırmacılar insan ruhunu AI ile deşifre etmek istiyor

amerikali

Yeni Üye


  1. Nasıl düşünüyoruz? Araştırmacılar insan ruhunu AI ile deşifre etmek istiyor

Bugünün AI manzarası hala dijital nöronal ağlar ve insan beyni arasındaki farklarla şekilleniyor. Bir yürümeye başlayan çocuk günde sadece bin kalori ve nasıl etkili bir şekilde iletişim kurabileceğine dair düzenli konuşmalarla öğrenir. Bu arada, teknoloji şirketleri veri merkezlerini tedarik etmek için atom enerji santralleri giyerek marjinal topluluklarda çevre kirliliğine yol açan veya büyük dil modellerini (büyük dil modelleri, LLMS) eğitmek için yırtıcı kitapların terabaytlarını kullanan gaz türbinlerine neden oluyor.



Beyin ve AI modellerinin benzerlikleri var


Ancak dijital sinir ağları da nöronal – beyinden ilham alıyorlar. Tamamen farklı enerji ve veri dengesine rağmen, büyük ses modelleri ve insan beyninin ortak noktası var. Her ikisi de milyonlarca sub bileşeninden oluşur: biyolojik nöronlar, yani beyin hücreleri, insanlar durumunda, bilgisayar durumunda simüle edilmiş nöronlar. Buna ek olarak, dünyada insan dilini akıcı ve esnek bir şekilde üretebilen sadece iki makine. Başka bir şey her ikisi için de yaygındır: bu güne kadar bilim adamları nasıl çalıştıklarını pek anlamıyorlar.

Kendim benzerlikler olduğunu doğrulayabilirim: Gazetecilik ve AI'ya nörobilimlerde altı yıllık bir derece ile geldim. Beyin araştırmacıları arasında, beyne benzeyen dijital nöronal ağların yapısının, alanımızın merkezi soruları açıklığa kavuşturması için en umut verici yollardan biri olduğu görüşüne sahipler. Ve: Bu görüş aynı zamanda psikolojiye de yayılmıştır.

Dergiyi bu şekilde yayınladı Doğa Son zamanlarda, psikolojik deneylerde insanların ve hayvanların davranışlarını tahmin etmek için nöronal ağların kullanımının sunulduğu iki çalışma sunulmuştur. Her iki çalışma da eğitimli ağların bilim adamlarının insan ruhu anlayışlarını geliştirmelerine yardımcı olabileceği sonucuna varmaktadır. Ancak davranışı tahmin etmek bir şeydir. Diğeri nasıl ortaya çıktığını açıklamaktır.

İnsan bilişinin temel modeli


Çalışmalardan birinde, araştırmacılar büyük bir ses modelini “insan bilişinin temel modeline” dönüştürdüler. Varsayılan olarak, büyük ses modelleri insan davranışını taklit etmede özellikle iyi değildir. Örneğin, insanların nedenlerini kapattıkları durumlarda, örneğin bir kumarhanede mantıklı davranırlar. Bu nedenle, Meta'nın açık kaynaklı lelmlerinden biri olan araştırmacılar Lama 3.1, örneğin bir dizi “slot makinesinden” en yüksek karı seçmek veya mektupları hatırlamak için verilere dayalı 160 psikolojik deneyini optimize etti. Ortaya çıkan model çağrı Centaur.



Basit matematik denklemleri kullanan geleneksel psikolojik modellerle karşılaştırıldığında, Centaur insanların davranışını daha iyi tahmin edebildi. İnsanların psikolojik deneylerde nasıl tepki verdiklerini tam olarak öngörmektedir: Bilim adamları, örneğin, insan katılımcılarını işe almadan ve ödemeden önce deneylerini bir bilgisayarda test etmek için Centaur'u kullanabilirler. Ancak yayınlarında araştırmacılar, Centaur'un sadece öngörücü bir makineden daha fazlası olabileceğini öne sürüyor. Bilim adamları, sistemin insan davranışını etkili bir şekilde yeniden üretmesini sağlayan mekanizmaları inceleyerek zihnimizin iç süreçleri hakkında yeni teoriler geliştirebilirler.



Bununla birlikte, bazı psikologlar projenin insan zihni hakkında çok şey söyleyebileceğinden şüphe ediyor. Elbette – insanların davranışını tahmin etmek söz konusu olduğunda geleneksel psikolojik modellerden daha iyidir. Ama aynı zamanda milyarlarca kat daha fazla parametre var. Ve bir modelin harici olarak bir kişi gibi davranması, içerideki bir kişi gibi çalıştığı anlamına gelmez. Hollanda'daki Radboud Üniversitesi'nde bilgisayar destekli bilişsel bilimler yardımcı doçent olan Olivia Konuk, Centaur'u matematiksel bir dahinin cevaplarını iki figürün toplamı sorununa etkili bir şekilde tahmin edebilen bir hesap makinesi ile karşılaştırır. “Bir hesap makinesini incelerseniz insan hesaplaması hakkında ne öğrenebileceğinizi bilmiyorum.”

Buna ek olarak, Centaur insan psikolojisi hakkında önemli şeyler içerse bile, bilim adamlarının modelin milyonlarca dijital nöronundan bilgi edinmeleri zor olabilir. Her ne kadar AI araştırmacıları büyük dil modellerinin işleyişini anlamak için yoğun bir şekilde çalışıyor olsalar da, bunları kırmayı başaramadılar. Onlar hala kara bir kutu – tam olarak nasıl ve neden çalıştıklarını bilmiyoruz. İnsan zihninin büyük bir nöronal ağ modelini anlamak, zihnimizin kendisini anlamaktan pek kolay olmamalıdır.

Daha İyi Başlangıç


Bu nedenle alternatif bir yaklaşım küçük başlamaktır. Bu nedenle iki doğa çalışmasının ikincisi, küçük dijital sinir ağlarına odaklanırlar, ancak farelerin, sıçanların, maymunların ve hatta insanların davranışını tahmin edebilecek sadece bir nöron içerir. Ağlar çok küçük olduğundan, her bir nöronun aktivitesini sürdürmek ve ağın davranış tahminlerini nasıl oluşturduğunu öğrenmek için bu verileri kullanmak mümkündür. Ve bu modellerin çalıştığının yanı sıra taklit etmeniz gereken biyolojik beyinlerin de bir garanti olmamasına rağmen, en azından insan ve hayvan bilişiyle ilgili hipotezleri kontrol etmek için kullanılabilirler.

Bu şeffaflığın fiyatı var. Düzinelerce farklı görevde insan davranışını taklit etmek için eğitilen Centaur'un aksine, küçük ağların her biri yalnızca belirli bir görev durumunda davranışı tahmin edebilir. Örneğin, bir ağ, insanların farklı slot makineleri arasında nasıl seçim yaptıkları konusunda tahminler yapma konusunda uzmanlaşmıştır. New York Üniversitesi'nde psikoloji ve nörobilim yardımcı doçenti olan Marcelo Mattar, “Davranış gerçekten karmaşıksa, büyük bir ağa ihtiyacınız var.” Diyor. “Uzlaşma, bunu anlamanın çok, çok zor olmasıydı.”

İfadenin kalitesi ile şeffaflık arasındaki uzlaşma, tüm kitapları doldurmak için kullanılabilecek sinir ağları tarafından teşvik edilen bilimin önemli bir özelliğidir – şu anda kendim üzerinde çalışıyorum. Mattar'ın çalışmaları gibi çalışmalar bize bu hedefe biraz daha yaklaşıyor. Ağları kadar küçük, davranışı daha kesin olarak geleneksel psikolojik modeller tahmin edebilirler.

Aynı şey, örneğin Antropik'ten Claude yapımcıları arasında işletilen LLM'lerin yorumlanabilirliği üzerine yapılan araştırmalar için de geçerlidir. Karmaşık sistemler hakkındaki anlayışımız – insanlardan iklime, proteinlere kadar – şu anda becerileri hakkında tahmin yapma yeteneğimizin çok gerisinde.

Bu yazı ilk olarak t3n.de.


(JLE)




Ne yazık ki, bu bağlantı artık geçerli değil.

Boşa harcanan eşyalara bağlantılar 7 günden daha büyükse veya çok sık çağrıldıklarında geçersiz hale gelir.


Bu makaleyi okumak için bir Haberler+ paketine ihtiyacınız var. Bir haftayı şimdi yükümlülük altına almadan test edin – yükümlülük olmadan!