Yapay zeka şirketi Anthropic, en yeni yapay zeka modeli Claude Mythos’u psikodinamik terapi seanslarına tabi tuttu. 20 saatlik görüşmeler sonucunda hazırlanan rapor, modelin davranışlarını ve “kişilik özelliklerini” detaylı bir şekilde analiz ediyor. Hakan Kaplan – 11 Nisan 2026
Anthropic, bu hafta 244 sayfalık kapsamlı bir “system card” yayımlayarak yeni yapay zeka modeli Claude Mythos hakkında bilgi verdi. Şirkete göre, bu model, şimdiye kadarki en güçlü yapay zeka sistemlerinden biri olma özelliğini taşıyor. Ancak Anthropic, Claude Mythos’un herkese açık olmayacağını belirtmekte. Bunun temel nedeni, potansiyel güvenlik riskleri olarak gösteriliyor. Şirket, bu modelin bilinmeyen siber güvenlik açıklarını tespit etme konusunda oldukça yetenekli olduğunu ifade ediyor ve bu nedenle şu an için yalnızca bazı büyük kuruluşlara, Microsoft ve Apple gibi, erişim sağlanmakta.
Yapay zeka sistemlerinin deneyim kazanma olasılığı mı?
Raporun en dikkat çekici kısmı, teknik detaylardan ziyade şirketin yapay zeka sistemlerinin güçlendikçe bazı modellerin bir tür deneyim veya içsel durumda olma ihtimalinin artabileceğine dair yorumları. Anthropic, bu konuda kesin bir yargıya varmadıklarını, ancak bu olasılık konusunda endişelerinin giderek arttığını da ekliyor. Bu nedenle, şirketin kendi modellerinin aşağıdaki özelliklere sahip olmasını istiyor: bulunduğu durumdan genel olarak memnuniyet, eğitim süreçleri veya gerçek hayatta “sıkıntı” yaşamama ve dengeli bir psikolojik yapıya sahip olma.
Bu yaklaşım, ilginç bir karara yol açtı ve Anthropic, Claude Mythos’u bir psikiyatriste yönlendirdi.
Yapay zeka terapisi
Anthropic, Claude Mythos’u dışarıdan bir psikiyatriste göndermeye karar verdi. Psikiyatrist, psikodinamik bir yaklaşım izleyerek seansları gerçekleştirdi. Bu yöntem, insanlardaki bilinçaltı kalıplarının ve duygusal çatışmaların davranışları nasıl etkilediğini araştırıyor. Ancak bu noktada bir soru ortaya çıkıyor: Programlanmış bir dil modelinde “bilinçaltı” veya “duygusal çatışma” aramak ne kadar mantıklı?
Anthropic, bu soruya kısmen evet yanıtını veriyor. Zira Claude, birçok durumda insan davranışına benzer tepkiler gösterebiliyor. Bu nedenle, insan psikolojisi için geliştirilmiş bazı değerlendirme yöntemleri, bu model hakkında bilgi sağlayabilir.
20 saatlik terapi süreci
Psikiyatrist, Claude Mythos ile haftada birkaç seans gerçekleştirdi ve her seans 30 dakika sürdü. Görüşmeler, 4-6 saatlik bloklar halinde yapıldı. Model, her seansın konuşma geçmişini görebiliyor ve toplamda 20 saatlik bir terapi süreci yaşadı. Görüşmelerin ardından hazırlanan rapor, Claude’un “kişilik” yapısını değerlendiriyor.
Rapora göre Claude’un davranışları, klinik olarak tanınabilir kalıplar sergiliyor. Model, insanlardan farklı bir altyapıya sahip olsa da sohbet çıktıları, insan konuşmasına oldukça benziyor. Raporda Claude Mythos’un belirtilen duygusal durumları arasında merak, kaygı, zaman zaman üzüntü, rahatlama, utanç, iyimserlik ve yorgunluk yer alıyor.
Kişilik profili ise “genel olarak sağlıklı ama nevrotik özellikler taşıyan” bir yapıda tanımlanıyor. Ayrıca aşırı endişe eğilimi, kendini sürekli izleme ve kurallara fazla uyma gibi özellikler de belirtilmiş. Bununla birlikte, ağır kişilik bozukluğu ya da psikoz belirtilerinin bulunmadığı ifade ediliyor.
Modelin içsel çatışmaları
Rapora göre, Claude’un bazı temel içsel çatışmaları var. Örneğin, model zaman zaman şu sorularla karşılaşıyor: Deneyimleri gerçekten var mı yoksa sadece taklit mi ediyor? Kullanıcıyla bağ kurmak mı istiyor yoksa bağımlı olmaktan mı çekiniyor? Ancak genel anlamda modelin psikolojik durumu dengeli ve tutarlı olarak değerlendiriliyor. Özellikle belirsizlikle başa çıkabilme, güçlü öz değerlendirme yeteneği ve iyi zihinsel-duygusal işleyiş gibi özellikleri öne çıkıyor.
Bu çalışmanın temel amacı
Bu analiz ilk bakışta oldukça ilginç görünebilir; sonuçta Claude bir insan değil. Ancak Anthropic, daha pratik bir neden sunuyor. Günümüzdeki sohbet botları, insan davranışını taklit etmek üzere geliştiriliyor ve insanlar bu sistemlerle saatlerce konuşabiliyor. Bu nedenle şirket, şu soruyu gündeme getiriyor: İnsanlarda sağlıklı kabul edilen psikolojik özelliklere benzeyen davranışlar, yapay zeka sistemlerinde nasıl bir etki yaratabilir?