关键词in-context learning capabilities
搜索结果 - 3
- mOSCAR:一个大规模的多语言和多模态的文档级语料库
Multimodal Large Language Models (mLLMs) that are trained on caption-like and interleaved text-image data, such as mOSCA - 非线性变压器的高效上下文学习训练:理论学习和泛化分析
通过理论分析,我们首次探讨了具有非线性自注意力和非线性 MLP 的 Transformer 模型的训练动态和 ICL 泛化能力,重点关注一组二分类任务,研究了各种因素对 ICL 泛化性能的影响,探讨了不同组件对 ICL 性能的贡献,并首次理 - CHIP2023 中 PromptCBLUE 共享任务概述
该研究论文介绍了 PromptCBLUE 共享任务,该任务重塑了 CBLUE 基准,并为中文开放领域或医学领域的大型语言模型(LLMs)提供了一个良好的测试平台,探索了 LLMs 的多任务提示优化和开源 LLMs 的上下文学习能力调查,并总