人工智能模型可能比你更懂你的购物欲望

15 小时前 18 技术
摘要
一项新的研究表明,人工智能模型可以反映人类的购买意图——模糊了调查受访者和模拟器之间的界限 。
币币情报道:

传统的消费者焦点小组可能正在被一种新技术取代:大型语言模型(LLM)。最新研究表明,这些人工智能模型能够以惊人的准确度预测人们的购买意图,甚至超越了传统营销工具。

曼海姆大学和苏黎世联邦理工学院的研究团队发现,通过将自由格式的文本转化为结构化数据,大型语言模型可以模拟人类对产品的购买意向。这种方法被称为“语义相似性评分”(Semantic Similarity Scoring, SSR),它利用嵌入空间中的语义距离将开放式回答映射到类似于李克特量表的五点评级系统。

研究人员指出,他们并未直接要求模型选择一个介于1到5之间的数字,而是让其自然回应,例如“我肯定会买这个”或“如果它打折的话可能会买”。随后,他们通过比较这些陈述与标准答案(如“我肯定会买这个”或“我不会买这个”)在语义上的接近程度,为每个回答分配相应的评分。

研究结果显示,该方法生成的合成受访者购买意向分布几乎与真实消费者的调查结果一致,且可靠度达到人工重测一致性水平的90%。这表明,经过优化的语义相似性技术可以在保持态度多样性的同时,精准地模仿人类判断。

为何这一发现至关重要?

这项研究可能会彻底改变企业进行市场调研的方式。传统的消费者调查通常成本高昂、耗时长,并且容易受到偏见影响。如果合成受访者的行为与真实受访者高度一致,那么公司只需极低成本即可快速筛选数千种产品或广告信息。

此外,这一成果还揭示了一个深层次的观点:大型语言模型不仅掌握了语言理解能力,还能推理出潜在的态度信息。通过分析嵌入空间中的答案,而非简单依赖文字匹配,该研究证明了模型语义具备令人惊叹的保真度。

然而,这种方法也带来了伦理和方法论方面的担忧。例如,尽管该研究仅测试了个人护理产品类别,但相同的技术可能被用于金融决策或政治敏感话题的预测与操纵。作者警告称,“市场驱动的优化压力会系统地侵蚀一致性”,而这种风险的影响范围远超营销领域。

存在的局限性与质疑

尽管研究取得突破,但仍存在一些局限性。一方面,当前实验仅限于个人护理产品这一狭窄领域,可能无法推广至高风险或情绪化的购买场景。另一方面,SSR 方法强烈依赖于精心设计的参考语句,任何细微的措辞变化都可能显著影响结果。

此外,研究使用的人工调查数据本身存在噪声大和文化偏见的问题。批评者进一步指出,基于嵌入的相似性假设未必适用于所有情境,尤其是在涉及复杂语境或讽刺表达时。虽然90%的重测一致性听起来令人印象深刻,但偏差的可能性依然不容忽视。

未来展望

随着人工智能技术的不断发展,越来越多的企业开始尝试基于AI的焦点小组和预测性民意调查。类似麻省理工学院和剑桥大学的研究表明,大型语言模型不仅能模拟人口统计学特征,还可以实现心理测量细分。然而,在此之前,尚无研究能像本次研究一样,成功展示其与真实购买意向数据的高统计匹配度。

目前,SSR 方法仍处于研究阶段,但它预示着未来大型语言模型或许不仅仅能回答问题,更能成为公众意见的代表。不过,这一趋势究竟是进步还是幻觉,仍有待进一步探讨。

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥1.25万亿
2 欧易OKX欧易OKX ¥3,972.77亿
3 HTXHTX ¥592.81亿
4 CoinbaseCoinbase ¥227.86亿
5 大门大门 ¥2,796.71亿
6 BitgetBitget ¥2,516.07亿
7 BybitBybit ¥3,107.30亿
8 双子星(Gemini)双子星(Gemini) ¥12.37亿
9 UpbitUpbit ¥174.76亿
10 Crypto.comCrypto.com ¥747.31亿