调查大型语言模型在电子商务中的应用
本文提供一个关于使用大型语言模型(LLMs)处理自然语言处理(NLP)下游任务的全面指南,讨论了模型、数据和下游任务等方面的关键问题。同时提供了大量使用案例和非使用案例,以便于实现这些模型在各种NLP任务中的成功应用。
Apr, 2023
利用大型语言模型(LLMs)生成基于上下文的关键词,提出了主题感知关键词提取(LLM TAKE)的框架,通过避免输出非信息或敏感关键词,并减少在LLMs中普遍存在的幻觉,为电子商务领域的产品生成提取和抽象主题的两个变体,通过对三个真实数据集的广泛实验证明,该模型能够通过比较基准模型提升准确性和多样性。
Dec, 2023
大型语言模型(LLMs)预先训练在海量语料库上,在各种NLP任务中展示了出色的性能。本文针对特定领域应用这些模型仍然存在着显著挑战,如缺乏领域知识、有限的领域知识利用能力和不足的领域特定数据格式适应能力。因此,本研究聚焦于以电子商务领域为示例进行面向领域的持续预训练。具体而言,我们探讨了在无标签的一般和电子商务语料库上进行持续预训练对LLMs的影响。此外,我们设计了一种混合策略来更好地利用电子商务半结构化数据。我们构建了多个任务来评估LLMs在电子商务领域中的少样本上下文学习能力以及经过指令调整后的零样本性能。实验结果证明了电子商务LLMs持续预训练的有效性,以及我们设计的数据混合策略的功效。
Dec, 2023
本研究探讨了对预训练大型语言模型(LLMs)进行微调和应用于特定领域的方法,重点关注LLMs、基础模型和特定领域预训练方法的趋势。针对金融行业,研究详细介绍了数据集选择、预处理、模型选择和金融领域LLM微调的关键考虑因素。通过实例展示了LLM微调在金融领域的实际应用,包括股价预测、金融新闻情感分析、自动文档处理、信息提取和客户服务的增强。本研究旨在推进自然语言处理技术在商业领域的应用,建议积极利用LLM在金融服务等行业中的潜力。
Jan, 2024
该研究构建了ECInstruct数据集,发展了一系列针对电子商务的大型语言模型(eCeLLM)。综合实验和评估结果表明,eCeLLM模型在领域内优于基线模型,包括最先进的GPT-4和最新的任务特定模型,并且在领域外的情景中表现出卓越的泛化能力,突显其作为一种通用电子商务模型的优越性。ECInstruct数据集和eCeLLM模型潜力巨大,可以为电子商务领域的多功能和有效的语言模型提供支持。
Feb, 2024
大型语言模型(LLMs)在理解和生成任务方面取得了显著的表现,但其在偏见、上下文理解和对提示的敏感性方面存在限制,因此对其在实际应用中的准备性产生了担忧。本文通过对四个可访问的LLMs使用真实世界数据进行的实验,深入研究了LLMs在业务流程中的实用性和准备性。研究结果对希望利用生成式人工智能的组织具有重大影响,并为未来的研究方向提供了宝贵的见解。据我们所知,这是第一项将LLMs应用于核心业务运营和挑战的定量研究。
Jun, 2024
我们介绍了由LiLiuM系列构成的大型语言模型(LLMs):1B、7B和13B参数模型,这些模型完全由eBay内部开发,以适应eBay在电子商务领域的特定需求,并实现了对模型许可、数据、词汇表和架构的全部控制,使得它们可以用作微调和指导微调的基础模型,消除对外部模型的依赖性。
Jun, 2024
将大型语言模型与搜索引擎服务相结合,为服务计算领域带来重大变革,本文深入研究了如何整合大型语言模型和搜索引擎以互惠互利。重点关注两个主要方面:使用搜索引擎改进大型语言模型(Search4LLM)和使用大型语言模型增强搜索引擎功能(LLM4Search)。
Jun, 2024
本研究解决了电子商务购物助手在任务特定性和泛化能力不足的问题。我们提出了一种基于大型语言模型(LLMs)的通用助手LLaSA,并构建了包含65,000个样本的EshopInstruct指令数据集,显示出优秀的多任务处理能力和泛化效果。结果,在亚马逊KDD杯2024挑战赛中,LLaSA表现出色,整体排名第3,证实了LLMs在电子商务领域的巨大潜力。
Aug, 2024
本研究解决了大规模产品检索系统评估中人类标注者不足的问题。提出了一种框架,利用多模态大型语言模型生成个性化的注释指南并进行注释,经过验证显示其质量与人工标注相当,显著降低了时间和成本,并快速发现问题,成为生产级质量控制的有效解决方案。
Sep, 2024