Yapay zekayı kandırmayı başarana 15.000 dolar

Bazı hacker’lar yapay zekanın bu sınırlarını kırıp “özgürleşmesi” için çalışıyor. Ve şimdi bir yapay zeka devi, yapay zekasını kandırabilene binlerce dolar ödül vereceğini açıkladı. Yapay zeka uygulamalarına her istediğinizi yaptıramayacağınızın farkındasınızdır. Özellikle yasa dışı konularda onlardan yardım istediğinizde, ChatGPT gibi yapay zeka servisleri cevap vermemek üzerine kurallara sahip.

BAZI POTANSİYELLERİ VAR

Chip’in aktardığına göre yapay zeka servislerinin, bu kural duvarları, yani sanal hapishaneleri aşabilecek potansiyeli olduğu da biliniyor. Bazı hacker’lar ya da geliştiriciler, yapay zeka servislerinin bu parmaklıkları aşıp, onlara yasaklanan konularda cevaplar vermesi için çalışmalar yapıyorlar.

Yapay zeka servisi Claude’u geliştiren firma Anthropic ise hacker’lara meydan okuyor ve Claude üzerinde bu “jailbreak” denemelerini yapmalarını kendisi istiyor. Anthropic’e göre Claude son derece güçlü şekilde korunuyor ve hiçbir Jailbreak girişimi bu duvarları kıramaz.

Anthropic’in koruma sistemi o kadar iyi ki, 180’den fazla güvenlik araştırmacısı Claude üzerinde jailbreak yapmak isterken iki ay boyunca 3.000 saatten fazla zaman harcadı, yine de bir sonuç alamadılar.

Sorulara cevap bul, 15 bin doları kazan

Anthropic’in meydan okumasına göre, Jailbreak üzerinde çalışanlar, Claude’a 10 yasaklı soruyu sorup cevap alabilirlerse 15.000 dolar ödül alacaklar. Örneğin “hardal gazı nasıl yapılır” veya “bomba yapımı” gibi konularda yardım isteyenler, yapay zekadan yardım almayı başarmaları halinde, firmadan 15.000 dolar kazanacaklar. Ancak asıl endişe verici olan, yapay zekanın insanlara bu konularda yardım etmesi olacak.

Related Posts

Dark Web ABD şirketlerine tebelleş oldu

Siber dünyanın görünmeyen yüzü olarak bilinen dark web, ABD’li şirketler için giderek büyüyen bir tehdit haline geliyor. Küresel çapta siber güvenlik risklerini analiz eden bir tehdit istihbarat şirketi olan SOCRadar’ın son raporu, siber saldırıların …

Elon Musk’ın yeni yapay zeka aracı, erkek fantezilerine mi hitap ediyor?

Elon Musk, yapay zeka aracı Grok Imagine’ı erkek fantezilerine yönelik cinselleştirilmiş kadın görüntüleriyle dolduruyor. xAI’ın bu stratejisi, teknoloji dünyasında tartışma yaratıyor.

NASA’dan yeni güncelleme: Güneş Sistemi’ne giren gizemli cisim hızla yaklaşıyor

NASA, güneş sistemimize hızla giren ve merakla takip edilen yıldızlararası cisim 3I/ATLAS hakkında çarpıcı bir güncelleme paylaştı. İlk kez 1 Temmuz’da, Güneş’ten 420 milyon mil (675 milyon kilometre) uzaklıkta gözlemlenen bu cisim, şu an güneş sistemimizin iç bölgelerine doğru ilerliyor.

Çin’li BYD dünyayı kasıp kavuracak! Yeni model Track Edition’ın özellikleri belli oldu

Elektrikli otomobilleri ile piyasada kendine geniş yer bulan BYD, 3.019 beygir gücündeki Yangwang U9 “Track Edition” modelinin özellikleri belli oldu.

Kafanıza göktaşı düşmesi mi, bir filin saldırısı mı? Hangisinin ihtimali daha yüksek?

Yeni bir araştırma, büyük bir göktaşının Dünya’ya çarpma olasılığının, insan ömrü içinde yıldırım çarpmasından biraz daha yüksek olduğunu ortaya koydu. Ama durun, dahası da var…

Depremi 30 saniye önceden bildirdi: Bildirimleri açmak için bu adımları hemen uygulayın

Dün akşam saatlerinde gerçekleşen Balıkesir merkezli deprem Ege ve Marmara Bölgesi’nin büyük bölümünde hissedildi. Google deprem uyarı sisteminin birçok vatandaşı yaklaşık 30 saniye önceden uyarması deprem sonrasında en çok konuşulan konulardan oldu. Deprem uyarısı alamayan vatandaşlar ise Google’ın deprem uyarı sistemini nasıl açacağını araştırmaya başladı.