$SmartProbe$: 市场调研问卷的虚拟调查员
通过使用基于强化学习(RL)的方法从clickstream数据中提取代理评分(proxy ratings),无需使用调查数据进行训练。代理评分比传统的调查数据更加直观和有用,可以有效地解决调查数据存在的各种缺陷。
Jun, 2020
通过结合大型语言模型的先进技术,我们定义了一个新的问题空间,旨在通过混合类型和混合主动式对话提供产品推荐和教育价值的对话代理系统。我们通过构建SalesBot和ShopperBot,对SalesBot与专业销售人员进行全面的人类研究比较,发现SalesBot在流畅度和信息量方面接近专业水平,但在推荐质量方面有所不足。我们强调了两者在提供真实信息方面的显著局限性,突出了在对话代理系统背景下确保忠实性的挑战。我们发布了代码并提供所有数据。
Oct, 2023
现在,移动经济的快速发展推动了在线营销活动的繁荣,其成功在很大程度上取决于用户偏好和所需营销活动之间的有效匹配,而良好建立的以营销为导向的知识图谱(称为MoKG)可以成为偏好传播的关键“桥梁”。本文旨在将领域级知识作为更好的以营销为导向的知识挖掘器,用于以LLM为基础的营销导向的知识图谱构建,然而在现实世界的营销场景中,这不是一件容易的事,存在着一些不可避免的问题,即LLM的不可控关系生成、单一提示的能力不足以及LLM的部署成本过高。为此,我们提出了一种新颖的渐进提示增强挖掘框架(PAIR),用于获取具有LLM的营销导向的知识图谱。具体而言,通过知识增强提示技术,我们将纯关系生成过程转化为基于LLM的自适应关系过滤过程。接下来,我们通过渐进提示增强引导LLM进行实体扩展,然后通过充分考虑自我一致性和语义相关性进行可靠的聚合。在在线服务方面,我们专注于一个小型的白盒PAIR(即LightPAIR),它是通过高质量语料库由强大的Teacher-LLM进行微调的。广泛的实验和在受众定位方面的实际应用验证了所提出的(Light)PAIR的有效性。
Dec, 2023
我们提出了ARALLM(即类比推理增强的大型语言模型),包括两个模块:基于类比推理的提示和推理增强多任务模型蒸馏。
Jan, 2024
Chatbot Arena是一种基于人类偏好评估大型语言模型的开放平台,通过对接受众来源的成对比较和众包输入的方式收集数据,并使用经过验证的统计方法进行评估和排名,以确保其可靠性和可信度,成为最有价值和最引用的大型语言模型排行榜之一。
Mar, 2024
人工智能广泛应用于解决与市场归因和预算优化相关的问题,然而由于模型复杂,很难在没有完整的实施团队的情况下理解模型的运作和见解,理论上,最近开发的大型语言模型(如GPT-4)可以用来提供营销见解,以减少做出关键决策所需的时间和精力。 实际上,要可靠地使用这些模型,需要克服一些重大挑战,我们聚焦于领域特定的问答、用于数据检索的SQL生成以及表格分析,并展示了如何通过语义搜索、提示工程和微调的结合来显著提高大型语言模型执行这些任务的准确性。我们比较了专有模型(如GPT-4)和开源模型(如Llama-2-70b),以及各种嵌入方法。这些模型在特定于市场混合建模和归因的样本用例上进行了测试。
Apr, 2024
在这篇论文中,我们提出了IntentionQA,一个双重任务多项选择问题回答基准,用于评估语言模型对电子商务中购买意图的理解能力。通过以购买的产品为基础推测意图,并利用它们预测额外的购买,LMs被赋予了推断意图的任务。IntentionQA包含了4,360个经过精心筛选的问题,涵盖了三个难度级别,使用自动化流程在大型电子商务平台上保证了可扩展性。人工评估结果表明我们的基准具有高质量和低误报率。我们的代码和数据公开在该网址。
Jun, 2024
本研究探讨了大型语言模型(LLMs)在促进已发布信息效果研究准确复制中的潜力。通过测试生成的AI角色,成功复制了133项来自14篇论文的实验发现,结果显示LLM能够重现76%的主要效果,表明其在加速市场研究中的应用前景,同时也指出了在复杂交互效应复制方面的局限性。
Aug, 2024
本研究探讨了大型语言模型(LLMs)在市场实验中的潜力,以理解其对竞争市场动态的理解能力。研究发现,当前LLMs在复制人类交易行为的动态决策过程中面临挑战,无法实现市场均衡,凸显了其在捕捉复杂市场行为方面的局限性。此研究为市场模拟提供了有价值的工具,但未来需加强其动态学习能力以提高在经济领域的有效性。
Sep, 2024
本研究针对电商平台上用户提出的产品相关问题,提出了多语言跨市场产品问答(MCPQA)的新任务,通过利用辅助市场的信息为用户提供准确答案。研究中构建了一个包含1700万问题的大型数据集,并展示了跨市场信息的引入显著提升了回答生成和问题排名的性能。
Sep, 2024