JBFuzz:使用模糊测试高效破解大型语言模型 Seebug Paper 3 months 2 weeks ago 作者:Vasudev Gohil 译者:知道创宇404实验室翻译组 原文链接:https://arxiv.org/html/2503.08990v1 摘要 大型语言模型(LLMs)作为语言理解和决策工具,展现出巨大的潜力,并已渗透到我们日常生活的各个方面。然而,其广泛可用性也带来了新的风险,例如通过一种称为“越狱”(jailbreaking)的攻击生成有害、不道德或冒犯性的内容。尽管 L...