BriefGPT.xyz
大模型
Ask
alpha
关键词
long-range context
搜索结果 - 3
ICLR
训练语言模型概括叙述能够提高大脑对齐
训练自然语言处理系统以深入理解语言是该领域的中心目标之一。本文从人类大脑理解自然语言的角度出发,研究了使用叙述数据集进行深层次叙事理解训练的语言模型是否真正学习了更深层次的文本理解,并表明了这种训练可以带来更好的大脑 - 自然语言处理对齐性
→
PDF
2 years ago
EMNLP
长程语言模型是否实际上使用了长程上下文?
该研究分析了两个能够接受高达 8K Token 的长文本转换器语言模型,发现将长距离上下文提供给这些模型只会在少数 Token 上提高其预测能力(例如可以从远处文本中复制的 Token),对于句子级别的预测任务没有任何帮助;并且长范围上下文
→
PDF
3 years ago
针对并发对话行为识别的长距离上下文建模
本文主要研究了如何使用卷积 - 循环神经网络对对话中的连续性行为进行识别,解决了当前对于长篇对话和复杂对话情境下预测难度较大的问题,同时在技术论坛数据集上取得了更为优异的效果。
PDF
5 years ago
Prev
Next