行内文本自动补全的顺序决策
通过提取自然语言的关键字,我们提出了一种无监督的文本自动完成方法,以权衡任务的效率、准确性和人类可读性,并呈现出在给定效率水平下比其他基线更准确的自动完成系统。
Nov, 2019
本论文提出了一种新的方法,利用在线模型选择算法在序列决策中高效地整合 LLM 代理,统计上显著优于传统决策算法和普通 LLM 代理,计算上避免了 LLM 梯度更新的高昂代价,并且在整个决策过程中只需要少量 LLM 调用。
Jun, 2024
采用预训练语言模型的语义理解能力,提出了一种新的序列推荐策略 LANCER,以弥补先前序列建模方法对上下文信息的不足,从而在推荐系统中生成更加人性化的个性化推荐。经过在多个基准数据集上的实验证明,我们的方法有效,具有良好的结果,并对我们的模型在序列推荐任务中的影响提供了有价值的见解。此外,我们的实验代码是公开可用的。
Sep, 2023
本文研究如何创建助手来帮助代理人解决新的顺序决策问题,介绍了一种新的辅助形式来模拟代理人的偏见,并提出了一种新的规划方法来缩放大型的决策问题,目的是为了获得比基于自动化的替代方案更高的累计奖励,最后我们证明了将建议和自动化相结合的方法比仅使用建议具有更好的性能,尽管会失去一些安全保证。
Feb, 2022
本研究提出了基于神经语言建模的深度学习方法,以改善基于流行度的方法无法预测未见过的查询的主要限制,并通过集成用户信息实现个性化建议,使用时间信息并研究如何增加建议的多样性,从而在准确性和可扩展性方面显著改善前人最佳方法,迈向生产搜索引擎中的神经查询自动完成。
Apr, 2018
这篇论文研究了在线社交推荐系统中的顺序投票机制与优化集成的现有理论和实证文献不一致的问题,提出在内容质量可以明确定义和客观测量的领域,比如教育领域,可以更好地评估社交推荐系统的设计选择,并通过大规模开放在线课程进行了行为实验,发现顺序投票系统可以比独立投票系统发现更好的内容。
Mar, 2016
本文研究的是低频用户提示模式或广泛提示的自动完成任务以及在受限内存下使用基于字符的语言模型降低整体模型大小的效果。研究证明,当控制模型大小时,字符模型的自动完成任务的精确匹配准确性与字模型相当。作者进一步尝试在字符模型中融入大型字模型的组成信息和表现转移的归纳偏差。
Oct, 2022