Sohbet botları sağlık tavsiyelerinin yarısında yanlış bilgi veriyor
Yeni bir araştırma, health advice yarısında hatalı bilgi veren yapay zeka sohbet botlarının kullanıcıları yanıltabileceğini ortaya koydu. study , ChatGPT, Gemini, DeepSeek, Meta AI ve Grok gibi popular botlar, kanser, aşı, beslenme ve kök hücre gibi kritik topics test edildi. Her birine açık ve kapalı uçlu toplam 10 soru yöneltilerek yanıtların doğruluğu, eksikliği ve clarity değerlendirildi.
Sonuçlar, BMJ Open dergisinde yayımlanan report paylaşıldı: sohbet botlarından gelen yanıtların %30'u somewhat , %20'si ise high düzeyde sorunlu bulundu. Araştırmacılar, bu yanıtların kullanıcılar tarafından professional help almadan uygulanması durumunda zarar verebileceğini ifade etti. Özellikle kronik veya acil tıbbi durumlar için verilen recommendations , risk oluşturabilecek hatalar barındırıyordu.
Botlar, closed-ended questions ve özellikle aşı ile kanser alanlarında daha iyi performans gösterdi. Ancak Grok, en çok hata yapan sistem olarak dikkat çekti. Gemini ise en az hatalı yanıtı üreten bot oldu. Araştırmacılar, botların yanıtlarının readability düzeyinin üniversite mezunlarının anlayabileceği karmaşıklıkta olduğunu, dolayısıyla yanlış bilgiyi daha ikna edici sunabileceklerini belirtti.
Yapay zeka sistemleri, real-time data erişemiyor. Bunun yerine eğitim verilerindeki istatistiksel patterns kullanarak yanıt üretiyor. Araştırmacılar, bu botların kanıtları evaluate , etik veya değer temelli kararlar make vurguladı. Bu nedenle, trust uyandıran ancak hatalı olabilecek yanıtlar oluşturabiliyorlar.
OpenAI, ChatGPT'ye aylık 230 bin sağlık sorusu yöneltildiğini açıkladı. Aynı dönemde hem OpenAI hem de Anthropic, sağlık odaklı özel sohbet botları launch duyurdu. Uzmanlar, bu araçların default settings tıbbi tavsiye için yeterli olmadığını, kullanıcıların sağlıklarını riske atmadan önce mutlaka bir uzmana danışmaları advice bulunuyor.
Bu risk gerçekten ciddi. Ben de çocukluğumda alerjim için botlara sordum, yanlış ilaç önerdi.
Botlar confidence güven veriyor ama arkasında gerçek doktor bilgisi yok. İnsanlar ikna olup hata yapabilir.
Eğitim verileri eskiyse, up-to-date güncel aşı önerileri bile yanlış çıkabilir. Bu çok tehlikeli.
Gemini'nin en az hata yapması biraz relief rahatlatıcı, ama hâlâ %50 hata oranı kabul edilemez.
Peki bu botlar neden medical advice tıbbi tavsiye veriyor ki? Ayarlar değişmeli, 'Doktor değilim' demeli.
İnsanlar quick answers hızlı cevap arıyor, Google yerine bot kullanıyor. Ama sonuçlar öyle değil ki.