央媒曝光AI涉黄事件哩布哩布致歉并封堵风险路径
一款名为“哩布哩布AI”的人工智能服务近日被中央媒体曝光涉及生成不良信息,引发公众对AI内容安全的广泛concern 。事件曝光后,该平台迅速通过微信公众号发布正式说明,承认在特定复杂提示词组合下,系统曾生成不符合规范的内容,并向用户和社会各界致以诚挚apology 。
平台在声明中指出,问题出现在少数边界场景中,例如用户使用规避表达或多重嵌套指令时,AI未能准确识别内容risk ,暴露出其在安全机制和内容审核上的短板。此次事件被视为一次严重警示,表明当前AI模型在内容safety 边界识别能力上仍有提升空间,尚未达到理想标准。
目前,相关技术漏洞已完成修复,所有已知风险路径均被封堵。平台还宣布升级审核机制,加强攻防drill ,以提升对异常输入的识别效率和响应速度。同时,内部已启动责任复盘流程,进一步优化管理与审核process ,力求从源头降低违规内容生成的可能性。
哩布哩布AI强调,内容安全是平台不可逾越的底线,未来将持续以更高标准完善安全体系。平台也公开邀请用户和社会共同监督,携手维护清朗网络space 。用户如发现异常,可通过指定渠道进行反馈,助力构建更健康、有序的AI服务ecosystem 。
技术再先进,也不能成为内容失控的借口。这次暴露的是审核机制的gap 漏洞,不是偶然现象。
用复杂提示词就能绕过过滤,说明模型的判断逻辑还是太机械,缺乏真正的语义understanding 理解能力。
攻防演练确实有必要,AI平台现在就像不断被黑客试探的网站,得时刻准备应对新型attack 攻击手段。
道歉来得挺快,但更关心后续的实际改进效果。别等下次被点名才临时patch 打补丁。
邀请社会监督听起来好听,可普通用户连反馈渠道都难找,透明度才是真正的challenge 挑战。
希望不是一阵风整改。AI发展越快,越要守住内容底线,不然技术越强,风险越大。