a16z领投Yupp:用加密技术重塑AI模型评估与反馈机制
作者:Chris Dixon,a16z crypto创始人;Elizabeth Harkavy,a16z crypto合伙人;翻译:金色财经xiaozou
现代人工智能系统的发展不仅依赖于算力和算法的进步,更离不开人类反馈的支持。目前,企业普遍采用人类反馈强化学习(RLHF)和直接偏好优化(DPO)等训练后优化技术,以减少偏见并提升模型对提示词的响应质量。然而,模型评估的关键在于明确何为“更好”,而这一步往往因缺乏透明度而受阻。
当前的主要挑战是:企业在数据和训练流程上趋于封闭,将其视为核心机密。这种做法导致AI模型评估只能依赖有限的封闭系统信息或脱离实际应用的静态基准测试,严重限制了模型改进的空间。同时,用户对自身反馈的影响缺乏了解,甚至无法确认反馈是否被采纳。尽管部分模型排行榜和众包平台试图改善透明度,但它们通常既无法让用户追溯自己的贡献,也不提供实质性的参与回报。
我们认为,加密技术可以为这一AI领域的灰色地带注入透明度和所有权保障。区块链不仅能帮助贡献者便捷获取奖励,还能为AI开发者提供可靠的反馈数据质量和来源保证。通过双向审计的开放市场,用户获得激励,开发者获取可信数据,从而实现双赢。
基于这一愿景,我们领投了消费级产品Yupp的3300万美元种子轮融资。Yupp是一个让每个人都能免费探索和对比最新AI模型的平台。
Yupp采用了众包模式进行模型评估:用户输入提示词,查看多个AI生成的响应,并选出最佳答案。这些选择会生成带有数字签名的偏好数据“数据包”,这些数据对AI训练后优化和评估具有重要价值。用户不仅能免费使用最新模型,还能根据提供的反馈获得奖励。
Yupp的设计将人类判断转化为可再生的经济资源。随着新交互数据的产生,旧数据会逐渐“过期”,形成一个自然的飞轮效应:更多用户的参与带来更新鲜的评估数据;更高质量的评估数据推动模型优化;优化后的模型吸引更多用户使用。所有参与者——无论是普通用户还是AI开发者——都可以加入其中,并看到透明且统一的规则,确保市场的中立性和可信度。无人能隐藏得分,也无人能操纵奖励或结果。
Yupp的创始团队在AI与加密领域均拥有深厚经验。团队成员曾在推特早期共同开发面向消费者的机器学习产品。Pankaj Gupta曾担任Google Pay和Coinbase的全球消费端工程负责人,Gilad Mishne则是GoogleX的机器学习负责人。初创团队汇聚了来自谷歌、Coinbase及顶尖实验室的高级工程师。
AI的发展需要一个基于大规模人类输入的强健可靠评估体系,而加密技术正是实现这一目标的信任机器。通过让全球用户贡献改进模型的反馈,Yupp致力于成为未来AI的基础评估层。我们很荣幸能支持Yupp,并期待协助他们构建链上反馈闭环,确保AI创新的成果由所有建设者共享。