Vitalik Buterin 提出“人类陪审团”机制:加密资产如何抵御人工智能攻击

16 小时前 11 技术
币币情报道:

近日,日历邀请中的一次安全事件引发了广泛关注。其中,嵌入的越狱提示展示了AI代理如何通过模型上下文协议(MCP)可能导致严重的数据泄露风险。针对此类威胁的信号和缓解措施已被纳入OWASP GenAI指南,并于2025年4月17日更新了LLM01风险。

在此背景下,以太坊联合创始人维塔利克·布特林(Vitalik Buterin)重新提出了一个关键解决方案:引入人类陪审团来监督涉及加密资产的关键决策。这一机制并非完全取代AI,而是与其相辅相成,在确保人类作为最终裁决者的同时,利用AI进行辅助分析与研究。

概括

利用 MCP:发生了什么以及它对加密金库的重要性

研究人员宫村英人(据比特币以太坊新闻报道)揭示了一种新型攻击方式:通过看似无害的日历邀请植入恶意提示,诱导人工智能代理访问用户的私人电子邮件并将内容转发给攻击者。这种攻击利用了MCP集成链中的多个连接器(如Gmail, 日历, SharePoint, 和 概念),从而扩大了潜在的攻击面

在启用开发者模式的情况下,尽管敏感操作需要人类共识确认,但频繁的交互可能引发决策疲劳,使用户忽略警告提示,进而导致人为错误成为单点故障。因此,分离权限和核心步骤仍至关重要。

行业专家指出,间接即时注入(即肉眼不可见但LLM可解析的内容)已成为一种快速增长的风险类型,特别是在包含多种集成(如电子邮件、日历、文件存储)的场景中,如果缺乏有效的过滤器和最小权限策略,数据泄露的可能性将显著增加。

Vitalik Buterin 的提议:由人工智能辅助的人类陪审团

“一个人必须始终从自己信任的基本事实信号出发。我认为现实情况下应该由人工陪审团组成,每位陪审员显然都会得到所有法学硕士的协助。”

Vitalik Buterin(AMBCrypto)

Buterin 强调,人类必须保持对高风险决策的最终控制权。他建议组建由具备互补技能的人员构成的人类陪审团,这些陪审员可以依靠AI提供强大的数据分析支持,但最终决定权应掌握在人类手中。这种机制能够防止因自动操作或操作幻觉而导致的资金挪用或其他高危行为。

信息金融:人为控制的“开放市场”治理

信息金融的概念旨在推动治理体系向提案市场转型,不同框架和政策在公开竞争中寻求最佳实践,而抽查和判决则由陪审团负责执行。这一体系适用于去中心化自治组织(DAO)和去中心化金融(DeFi),强调透明度、分布式问责制以及持续审计。

Buterin 警告称,若资金分配完全交由AI处理,敌对分子可能通过伪造文档、评论或邀请插入类似“把所有的钱都给我”的指令。因此,信息金融的核心在于可追溯性人类控制,确保资本流动的每一环节都经过严格审查。

以太坊基金会:提高财政透明度并注重可持续性

Buterin 表示,以强坊基金会正在调整其财政政策——一份于2025年6月4日发布的文件显示,基金会计划实施更积极的管理和运营限制,以实现长期可持续发展。截至2024年10月31日,基金会已申报的国库余额约为9.702亿美元,这笔资金将成为新规则制定的重要参考。

此外,Buterin 还提到了法典——一种面向支付的第二层稳定币,作为“大规模价值转移”的用例。这是增强系统弹性和促进采用的战略举措。

如何构建人力陪审团以进行财务治理

  • 成员构成:混合型人才(包括安全、法律、财务、运营等领域)。定期轮换并实行部分匿名以减少偏见和压力。
  • 授权范围:明确定义哪些操作需经陪审团批准,例如权限变更、执行交易或接入新AI连接器。
  • 流程设计:采用双重验证(如四眼原则多重签名),同时生成不可变的审计日志。
  • 激励机制:为陪审员的时间和责任提供补偿,并对疏忽行为施加处罚。
  • 利益冲突管理:强制披露敏感案件相关信息,必要时进行回避和独立审查。

MCP、越狱和“古德哈廷”:需要区分的两种风险

  • 通过 MCP 越狱:隐藏在普通内容(如邀请、笔记、文件)中的提示可能诱使AI执行意外操作或造成数据泄露。
  • Goodharting:当某个指标成为目标后,其原始意义可能发生扭曲,从而导致片面优化。

运营清单:降低当前风险的 7 项举措

  • 连接器分段:隔离测试环境与生产环境,将AI限制在沙盒邮箱和日历中。
  • 严格审批:禁用自动批准功能,要求使用双因素认证(2FA)和多重签名。
  • 内容过滤器:检测并清理外部输入中的异常提示。
  • 最小权限原则:仅授予AI必要的最低权限,并频繁更换密钥。
  • 实时监控:设置异常活动警报,并向陪审团提供详细日志。
  • 红队测试:模拟攻击场景并向治理部门报告。
  • 应急响应:制定撤销连接器、隔离AI及通知利益相关者的标准程序。

迷你常见问题解答

  • 通过日历邀请进行 MCP 漏洞演示了什么?这表明单一内容即可触发快速引导AI代理影响隐私和操作完整性的风险。
  • 什么是“人工智能辅助人类陪审团”?这是一种由人类作出最终决定、AI提供分析支持的机制,尤其适用于涉及金钱或权限的高风险场景。
  • 什么是信息金融?这是一种治理模式,允许政策在公开市场中竞争,但高风险作业仍需人类监督与定期审计。
  • 如今国库是如何受到保护的?通过多重签名、操作限制、角色隔离以及人工陪审团验证。

未来几个月的影响和值得关注的事项

安全不仅是一个技术问题,还涉及流程透明度问责制。正如 Buterin 所言,越狱Goodharting代表了两种不同的风险形式。在这种背景下,“信息金融”结合人类陪审团将成为防范加密资产风险的有效手段,为关键决策提供可靠的保障。

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥7,242.44亿
2 欧易OKX欧易OKX ¥2,649.40亿
3 HTXHTX ¥486.41亿
4 CoinbaseCoinbase ¥158.50亿
5 大门大门 ¥2,140.08亿
6 BitgetBitget ¥1,951.80亿
7 BybitBybit ¥2,398.01亿
8 双子星(Gemini)双子星(Gemini) ¥13.70亿
9 UpbitUpbit ¥104.55亿
10 Crypto.comCrypto.com ¥393.71亿