Çalışmalar

Eylem tahmin hatası: istikrarlı öğrenmeyi sağlayan değerden bağımsız bir dopaminerjik öğretim sinyali

Hayvanların seçim davranışı iki ana eğilimle karakterize edilir: ödüllere yol açan eylemlerde bulunmak ve geçmişteki eylemleri tekrarlamak. Teori, bu stratejilerin farklı dopaminerjik öğretim sinyalleriyle güçlendirilebileceğini öne sürüyor: değere dayalı çağrışımları güçlendirmek için ödül tahmin hatası (RPE) ve değerden bağımsız tekrarlayan çağrışımları güçlendirmek için harekete dayalı eylem tahmin hataları. Burada, striatumun kuyruğundaki hareketle ilgili dopamin aktivitesinin, varsayılan eylem tahmini hata sinyalini kodladığını göstermek için farelerde bir işitsel ayrım görevi kullanıyoruz. Nedensel manipülasyonlar, bu tahmin hatasının, tekrarlanan çağrışımları güçlendirerek öğrenmeyi destekleyen, değerden bağımsız bir öğretme sinyali olarak hizmet ettiğini ortaya koymaktadır. Hesaplamalı modelleme ve deneyler, eylem tahmin hatalarının ödül güdümlü öğrenmeyi destekleyemediğini, ancak RPE devresi ile eşleştirildiğinde, değerden bağımsız bir şekilde kararlı ses-eylem ilişkilendirmelerini birleştirmeye hizmet ettiğini göstermektedir. Birlikte, öğrenmeyi desteklemek için birlikte çalışan iki tür dopaminerjik tahmin hatası olduğunu gösteriyoruz.

Yazının devamına buradan ulaşabilirsiniz

İlgili Makaleler

Başa dön tuşu