摘要
随着电子商务的快速发展,网络购物平台已成为消费者在数字市场中导航的关键入口。然而,这种快速扩张也导致了信息环境的嘈杂与碎片化,增加了用户在线探索和购买商品时的认知负担。代理系统在自动化用户端任务方面展现出巨大潜力,但现有基准测试未能全面评估其在开放网络环境中进行商品推荐的能力。为此,本文提出AgenticShop,这是首个用于评估代理系统在开放网络环境中进行个性化商品推荐的基准测试。该方法包含真实的购物场景、多样的用户画像以及可验证的个性化评估框架。通过大量实验,我们发现当前代理系统仍存在较大不足,突显了开发能够有效跨现代网络推荐定制化商品的用户端系统的重要性。
AI 推荐理由
论文聚焦于Agent在开放网络环境中进行个性化商品推荐的规划与任务执行能力,涉及任务分解和目标导向行为。
论文信息