科技公司角私家侦探，侦探公司，调查公司，查人找物，商务调查，出轨外遇调查，婚外情调查，私人调查，19209219596逐新技防AI逃逸

人参与 | 时间：2026-03-23 05:45:00

刘霞

随着人工智能（AI）技术迅速普及，新的安全漏洞和“越狱”方法日益增多，这给黑客提供了一种便利去恶意利用这些系统，实施网络攻击、传播不当信息，并引发重大犯罪行为。鉴于此，全球科技巨头竞相开发新技术以防止AI模型被滥用，并有效减少其风险。

人工智能“逃跑”的情况正在不断恶化。

IBM网站解释说：当黑客或别有用心之人通过入侵AI系统中的漏洞，突破伦理准则操纵AI模型生成非法或危险内容时，便视为“越狱”。惯用的AI“越狱”手段包括植入提示语、诱导角色扮演、现在就做任何事（DAN），以及拆分敏感词。

提示词植入：指在输入中插入特定指令或改变输入的语义结构，并且引导模型执行非预期操作或生成错误的结果。

通过精心构建的指导建议，这些技术促使AI模型偏离预先设置的安全规范，创建可能产生危害的内容，甚至造成数据泄密以及系统紊乱等方面的严重问题。

研究表明，在没有防护措施的情况下，通过生成式人工智能“越狱”的成功率非常高，达20%。通常来说，攻击者只需花费大约42秒及进行5次交互，就能轻易突破防线。在某些情况下，这种行为甚至只需要短短几分钟便能完成。私家侦探，侦探公司，调查公司，查人找物，商务调查，出轨外遇调查，婚外情调查，私人调查，19209219596这些发现揭示了当前生成式人工智能算法中存在的重大缺陷，在应对这类问题时实时阻止漏洞的难度极大。

IBM指出，“越狱”事件越来越普遍，主要是由于AI技术快速进步、AI工具的可用度显著提升以及对未经筛选内容需求的增长。安全界人士则认为，生成式聊天机器人的易用性使得任何人都能轻易接触危险信息。

设置虚拟保护墙

为了促进AI的发展并保证其安全性与可控性，以微软以及虚拟现实（VR）平台为代表的高科技企业都致力于解决AI“脱缰”问题。

据路透社报道，《金融时报》刊文称，AI初创企业Anthropic推出了名为"宪法分类器"的新系统，可以为大型语言模型提供额外保护，以检测输入和输出中的潜在有害内容，从而保护用户不受不良信息的影响。

这种解决方案基于一个名为“宪法”的规则框架。这套规则为信息提供了清晰定义并灵活调控的边界，可以适用于不同类型的信息素材。

Anthropic公司为验证这一系统的效果提供了高达15000美元的“漏洞赏金”。为了破译防御，有183位测试者在历时3,000多个小时后投入尝试。由于宪法分类器的防护存在，其“克劳德3.5”模型成功抵御了95%以上恶意攻击企图，拒绝率则仅为14%；反之，在未设此防护的情况下，该模型拒收请求比例提高至86%。

无独有偶，去年3月，微软亦推出了一项创新工具，“提私家侦探，侦探公司，调查公司，查人找物，商务调查，出轨外遇调查，婚外情调查，私人调查，19209219596示词防护盾”，旨在实时侦测并有效阻止人工智能模型“越狱”的“提示词攻击”。同时，微软还解决了另一个挑战性问题——间接的提示词输入，即将恶意指令悄悄地插入到人工智能模型训练数据中从而避免其执行不当的操作。

值得一说的是，微软还在新系统中加入了一项新功能，当人工智能（AI）模型制造内容、行为异常或者输出低效时，就能快速告知使用者这些状况。

在加州伯克利分校和元宇宙平台的合作下，一种通用防御框架将在2024年底推出，用于对抗由战略投放的提示词引发的威胁。这将对人工智能安全系统构成另一层保护。

技术成本有待进一步下降

当然这些技术旨在预防 AI 越狱，但它们并非十全十美。

干预措施可能导致模型变得更加谨慎从而限制其功能而拒绝对非有害请求。例如谷歌早期版本的“双子座AI模型”以及元宇宙平台上的Llama 2都曾出现过此类情况。不过Anthropic公司表示，它的宪法分类器虽然提高了拒绝率但是相对于其他模型来说仍然相对较低大约增加了0.38%

金融时报表示，“宪法分类器”在运行过程中，消耗大量计算资源，对于那些已经为训练和运行模型支付了巨额费用的公司来说，无疑是雪上加霜。Anthropic公司也承认，其分类器将使运行AI模型的成本增加近24%。

由此可知，尽管AI“越狱”防护系统在提高安全性和防止数据泄露方面起着重要作用，但仍需要仔细权衡这两者之间的平衡点。

顶: 58踩: 5

不屈不挠网

科技公司角私家侦探，侦探公司，调查公司，查人找物，商务调查，出轨外遇调查，婚外情调查，私人调查，19209219596逐新技防AI逃逸

人参与 | 时间：2026-03-23 05:45:00

评论专区

相关文章