Gemini, kendi silahıyla kandırıldı

Araştırmacılar, Google'ın yapay zeka modeli Gemini'nin eğitim sürecindeki geri bildirimlerini kullanarak onu kandırmanın yeni bir yolunu keşfetti. "Fun-Tuning" adı verilen bu yöntemle, etkisiz komutlar güçlendirilerek Gemini'nin yanıtları manipüle edildi. Elde edilen başarı oranları, farklı Gemini modellerinde %65 ile %82 arasında değişiyor.

Kaynak: Webtekno

İlginizi çekebilir