Yapay Zeka

Yapay Zeka Aracı, Sorunları Daha İyi Çözmek için Programlamayı ve Dili Birleştiriyor

Özet: Araştırmacılar, yapay zeka modellerinin Python programları üretip yürüterek karmaşık görevleri çözmesine olanak tanıyan doğal dil gömülü programlar (NLEP’ler) geliştirdiler.

Bu yöntem, muhakeme görevlerinde doğruluğu artırır ve kullanıcıların kodu incelemesine ve düzeltmesine olanak tanıyarak şeffaflığı artırır. NLEP’ler ayrıca bilgileri yerel olarak işleyerek veri gizliliğini de artırır.

Ana unsurlar:

  1. NLEP’ler yapay zekayı karmaşık görevleri çözmek için Python programları oluşturmaya yönlendirir.
  2. Yöntem doğruluğu ve şeffaflığı artırarak kod incelemesine olanak tanır.
  3. NLEP’ler bilgileri yerel olarak işleyerek veri gizliliğini artırır.

Kaynak: İLE

ChatGPT’yi destekleyenler gibi büyük dil modelleri, yasal özetlerin hazırlanması, müşteri incelemelerinin duyarlılığının analiz edilmesi veya belgelerin farklı dillere çevrilmesi gibi görevlerde etkileyici performans göstermiştir.

Bu makine öğrenimi modelleri genellikle bilgiyi işlemek ve sorguları yanıtlamak için yalnızca doğal dili kullanır; bu da onların sayısal veya sembolik akıl yürütme gerektiren görevleri yerine getirmesini zorlaştırabilir.

Örneğin, büyük bir dil modeli, son ABD başkanlarının ve doğum günlerinin bir listesini ezberleyebilir ve okuyabilir, ancak aynı model, “1950’den sonra seçilen hangi ABD başkanları Çarşamba günü doğdu?” Sorusu sorulduğunda başarısız olabilir. (Cevap Jimmy Carter’dır.)

Bu bilgisayar kodunu gösterir.
Ayrıca NLEP’ler, maliyetli bir süreç olabilen belirli bir görev için bir modeli yeniden eğitmeye gerek kalmadan küçük dil modellerinin daha iyi performans göstermesini sağlayabilir. Kredi: Nörobilim Haberleri

MIT ve diğer yerlerden araştırmacılar, büyük dil modellerinin programlar oluşturarak doğal dil, matematik ve veri analizi ile sembolik akıl yürütme görevlerini çözmesine olanak tanıyan yeni bir teknik önerdiler.

Doğal dil gömülü programlar (NLEP’ler) olarak adlandırılan yaklaşımları, bir kullanıcının sorgusunu çözmek için bir Python programı oluşturup yürütmesi için bir dil modelinin yönlendirilmesini ve ardından çözümün doğal dil olarak çıktısını almayı içerir.

NLEP’lerin büyük dil modellerinin çok çeşitli muhakeme görevlerinde daha yüksek doğruluk elde etmesini sağladığını buldular. Yaklaşım aynı zamanda genelleştirilebilir; bu, bir NLEP isteminin birden fazla görev için yeniden kullanılabileceği anlamına gelir.

NLEP’ler ayrıca şeffaflığı da artırır; çünkü kullanıcı, modelin sorgu hakkında tam olarak nasıl mantık yürüttüğünü görmek için programı kontrol edebilir ve model yanlış yanıt verirse programı düzeltebilir.

“Yapay zekanın karmaşık akıl yürütmeyi şeffaf ve güvenilir bir şekilde gerçekleştirmesini istiyoruz. Hala gidilecek uzun bir yol var, ancak programlama ve doğal dil yeteneklerini geniş dil modellerinde birleştirmenin, insanların yapay zekalarının içinde olup bitenleri tam olarak anlayıp güvenebilecekleri bir geleceğe doğru çok iyi bir potansiyel ilk adım olduğunu gösterdik. model” diyor MIT doktora sonrası araştırmacısı ve NLEP’ler üzerine bir makalenin ortak başyazarı olan Hongyin Luo PhD ’22.

Makalede Luo’ya Hong Kong Çin Üniversitesi’nde yüksek lisans öğrencisi olan eşbaşkan yazarlar Tianhua Zhang da eşlik ediyor; ve Pekin Üniversitesi’nde lisans öğrencisi olan Jiaxin Ge; MIT Elektrik Mühendisliği ve Bilgisayar Bilimleri Bölümü’nde yardımcı doçent ve Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı (CSAIL) üyesi Yoon Kim; kıdemli yazar James Glass, kıdemli araştırma bilimcisi ve CSAIL’deki Konuşulan Dil Sistemleri Grubunun başkanı; ve diğerleri. Araştırma, Hesaplamalı Dilbilim Derneği’nin Kuzey Amerika Bölümünün Yıllık Konferansında sunulacak.

Programlarla problem çözme

Birçok popüler büyük dil modeli, bazı doğal dil girdileri göz önüne alındığında bir sonraki kelimeyi veya belirteci tahmin ederek çalışır. GPT-4 gibi modeller program yazmak için kullanılabilirken, bu programları doğal dilin içine yerleştirir ve bu da program muhakemesinde veya sonuçlarında hatalara yol açabilir.

MIT araştırmacıları NLEP’ler konusunda tam tersi bir yaklaşım benimsedi. Modelin tamamen Python koduyla adım adım bir program oluşturmasını ve ardından gerekli doğal dili programın içine yerleştirmesini isterler.

NLEP, dört adımdan oluşan bir problem çözme şablonudur. İlk olarak model gerekli paketleri veya işlevleri çağırır, görevi çözmesi gerekecektir. İkinci adım, görevin gerektirdiği bilginin doğal dildeki temsillerinin (ABD başkanlarının doğum günleri listesi gibi) içe aktarılmasını içerir.

Üçüncü adım için model, cevabı hesaplayan bir fonksiyonu uygular. Ve son adımda model, gerekirse otomatik veri görselleştirmeyle sonucu doğal dilin bir satırı olarak çıktı olarak verir.

Luo, “Program doğru olduğu sürece size her zaman doğru hesaplama sonucunu veren dijital bir hesap makinesine benziyor” diyor.

Kullanıcı, sorunu gidermek için tüm modeli yeniden çalıştırmaya gerek kalmadan programı kolayca araştırabilir ve koddaki hataları doğrudan düzeltebilir.

Bu yaklaşım aynı zamanda diğer bazı yöntemlerden daha fazla verimlilik sunar. Bir kullanıcının çok sayıda benzer sorusu varsa, bir çekirdek program oluşturabilir ve ardından modeli tekrar tekrar çalıştırmaya gerek kalmadan belirli değişkenleri değiştirebilir.

Modelin bir NLEP oluşturmasını sağlamak için araştırmacılar modele bir Python programı yazmaya yönelik genel bir talimat veriyor, iki NLEP örneği (biri matematik ve biri doğal dil ile) ve bir test sorusu sağlıyor.

“Genellikle insanlar bu tür birkaç adımlık yönlendirme yaptıklarında, yine de her görev için yönlendirmeler tasarlamaları gerekiyor. Birçok görev için tek bir komut istemine sahip olabileceğimizi gördük çünkü bu, LLM’lere tek bir sorunu çözmeyi öğreten bir istem değil, LLM’lere bir program yazarak birçok sorunu çözmeyi öğreten bir istemdir” diyor Luo.

MIT-IBM Watson Yapay Zeka Laboratuvarı’nın baş bilim insanı Leonid Karlinsky, “Dil modellerinin kodla akıl yürütmesine sahip olmak, araç kullanımı, çıktı doğrulama, modelin yeteneklerinin ve düşünme biçiminin daha yapılandırılmış anlaşılması ve daha fazlası için birçok fırsatın kilidini açıyor” diyor.

“Burada sihir yok”

NLEP’ler, GPT-4’ü karıştırılmış nesneleri takip etme veya 24 kişilik bir oyun oynamanın yanı sıra talimat izleme ve metin sınıflandırma görevleri gibi bir dizi sembolik akıl yürütme görevini çözmesi için yönlendirirken yüzde 90’dan fazla doğruluk elde etti.

Araştırmacılar, NLEP’lerin göreve özel yönlendirme yöntemlerinden yüzde 30 daha fazla doğruluk sergilediğini bile buldu. Yöntem aynı zamanda açık kaynaklı LLM’lere göre iyileştirmeler de gösterdi.

NLEP’ler, büyük dil modellerinin doğruluğunu artırmanın yanı sıra veri gizliliğini de geliştirebilir. NLEP programları yerel olarak çalıştırıldığı için hassas kullanıcı verilerinin bir model tarafından işlenmek üzere OpenAI veya Google gibi bir şirkete gönderilmesine gerek yoktur.

Ayrıca NLEP’ler, maliyetli bir süreç olabilen belirli bir görev için bir modeli yeniden eğitmeye gerek kalmadan küçük dil modellerinin daha iyi performans göstermesini sağlayabilir.

“Burada sihir yok. Daha pahalı ya da süslü bir dil modelimiz yok. Yaptığımız tek şey, doğal dil oluşturmak yerine program oluşturmayı kullanmak ve bunun önemli ölçüde daha iyi performans göstermesini sağlayabiliriz,” diyor Luo.

Bununla birlikte, bir NLEP, modelin program oluşturma yeteneğine dayanır, bu nedenle teknik, sınırlı veri kümeleri üzerinde eğitilmiş daha küçük modeller için de işe yaramaz.

Gelecekte araştırmacılar, daha küçük dil modellerinin daha etkili NLEP’ler üretmesini sağlayacak yöntemler üzerinde çalışmayı planlıyor. Buna ek olarak, modelin muhakeme süreçlerinin sağlamlığını arttırmak için anlık değişimlerin NLEP’ler üzerindeki etkisini araştırmak istiyorlar.

Finansman: Bu araştırma kısmen Hong Kong Algısal ve İnteraktif Zeka Merkezi tarafından desteklenmiştir.

Bu yapay zeka araştırma haberi hakkında

Kaynak ve İleri Okuma: https://neurosciencenews.com/nlep-ai-language-26329/

İlgili Makaleler

Başa dön tuşu