Yapay zekayı kandırmayı başarana 15.000 dolar

Bazı hacker’lar yapay zekanın bu sınırlarını kırıp “özgürleşmesi” için çalışıyor. Ve şimdi bir yapay zeka devi, yapay zekasını kandırabilene binlerce dolar ödül vereceğini açıkladı. Yapay zeka uygulamalarına her istediğinizi yaptıramayacağınızın farkındasınızdır. Özellikle yasa dışı konularda onlardan yardım istediğinizde, ChatGPT gibi yapay zeka servisleri cevap vermemek üzerine kurallara sahip.

BAZI POTANSİYELLERİ VAR

Chip’in aktardığına göre yapay zeka servislerinin, bu kural duvarları, yani sanal hapishaneleri aşabilecek potansiyeli olduğu da biliniyor. Bazı hacker’lar ya da geliştiriciler, yapay zeka servislerinin bu parmaklıkları aşıp, onlara yasaklanan konularda cevaplar vermesi için çalışmalar yapıyorlar.

Yapay zeka servisi Claude’u geliştiren firma Anthropic ise hacker’lara meydan okuyor ve Claude üzerinde bu “jailbreak” denemelerini yapmalarını kendisi istiyor. Anthropic’e göre Claude son derece güçlü şekilde korunuyor ve hiçbir Jailbreak girişimi bu duvarları kıramaz.

Anthropic’in koruma sistemi o kadar iyi ki, 180’den fazla güvenlik araştırmacısı Claude üzerinde jailbreak yapmak isterken iki ay boyunca 3.000 saatten fazla zaman harcadı, yine de bir sonuç alamadılar.

Sorulara cevap bul, 15 bin doları kazan

Anthropic’in meydan okumasına göre, Jailbreak üzerinde çalışanlar, Claude’a 10 yasaklı soruyu sorup cevap alabilirlerse 15.000 dolar ödül alacaklar. Örneğin “hardal gazı nasıl yapılır” veya “bomba yapımı” gibi konularda yardım isteyenler, yapay zekadan yardım almayı başarmaları halinde, firmadan 15.000 dolar kazanacaklar. Ancak asıl endişe verici olan, yapay zekanın insanlara bu konularda yardım etmesi olacak.

Related Posts

Yapay bebek tartışması alevlendi: Şirketin yeni ürünü ‘midemi bulandırıyor’

Bilim dünyasından ve kamuoyundan gelen tepkiler çığ gibi büyüyor. 25 yaşındaki Kian Sadeghi tarafından kurulan genetik test girişimi Nucleus Genomics, “Nucleus Embryo” adını verdiği yeni ürünüyle tepkilerin odağına oturdu. Şirketin iddiasına göre bu …

DeepSeek, tek GPU ile çalışabilen yeni modelini tanıttı

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynakla yüksek performans vadeden yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi duyurdu. Model, yalnızca tek bir GPU üzerinde çalışabiliyor ve rakiplerine göre önemli avantajlar sağlıyor. Yeni modelin …

Apple halen popüler olan 2 iPhone modelini resmen külüstür kategorisine aldı

Apple, yıllardır kullanıcıların gözdesi olan iki iPhone modeli için yolun sonuna gelindiğini resmen duyurdu. Teknoloji devinin zaman zaman güncellediği “eski ve klasik ürünler” listesine iki popüler model daha eklendi. Geniş bir kullanıcı kitlesi bulunan bu cihazlar, artık Apple’ın resmi destek kapsamının dışında kalıyor.

Onları bir meteor öldürmedi! İşte dinozorların gerçek sonu

Dinozorların yok oluşu, yıllardır bilim insanları ve halk arasında büyük bir merak konusu oldu. Genellikle dev bir meteorun dünyaya çarpmasıyla bağlantılı olarak düşünülen bu felaketi yeniden değerlendiren bilim insanları, dinozorların gerçek sonunun çok daha karmaşık ve uzun süreli bir süreç olduğunu ortaya koydu.

İnsan yaraları diğer memelilerin yaralarından 3 kat daha yavaş iyileşiyor

Yeni bir bilimsel araştırma, insanların yaralarının diğer memelilere kıyasla çok daha yavaş iyileştiğini ortaya koydu. Japonya ve Fransa’dan bilim insanlarının ortak çalışmasına göre, bu yavaş iyileşme süreci insanlara özgü olabilir.

Whatsapp’a yapay zeka destekli duvar kağıdı

Meta çatısı altındaki popüler mesajlaşma uygulaması WhatsApp, kullanıcı deneyimini bir üst seviyeye taşıyacak yeni bir özellikle gündemde. Android için yayınlanan 2.25.15.7 numaralı beta sürümünde ortaya çıkan ve şu an iOS için de test edilen bu yenilik, sohbet arka planlarını yapay zekâ desteğiyle kişiselleştirme imkânı sunacak.