BriefGPT.xyz
大模型
Ask
alpha
关键词
long-sequence techniques
搜索结果 - 1
LongBoX:评估基于 Transformer 的长序列临床任务
评估长序列处理能力的医学大型语言模型和模型性能,引入长序列数据集 LongBoX,初步实验证明医学和一般领域大型语言模型对长序列的处理存在困难,通过两种长序列处理技术(局部 - 全局注意力、Fusion-in-Decoder)的评估,得出虽
→
PDF
8 months ago
Prev
Next