关键词multilingual applications
搜索结果 - 7
- 突破语言障碍:直接推断是否能在多语言 LLM 应用中胜过预翻译?
这项研究通过对 108 种不同语言和 6 个多样化基准测试进行全面调查,重新评估了 PaLM2 模型的预翻译需求,并发现 PaLM2-L 在 94 种语言中持续优于预翻译,揭示了直接推理在多语言应用中的优势,为更高效、更有效的多语言应用铺平 - 跨语言知识图谱实体标签映射的统计和神经方法
本研究探讨使用单词和句子对齐技术以及匹配算法来对来自特定多个语言的 Wikidata 实体标签进行对齐,并展示使用该技术能显着提高信息一致性的 F1 得分,尤其是使用句子嵌入技术的方法,这将可以用于机器翻译等领域。
- 悟空:一个亿级中文跨模态预训练基准
本文发布了一个名为 Wukong 的大规模中文跨模态数据集,旨在用于不同模态的预训练方法基准测试以促进 VLP 研究和社区发展,并通过扩展实验以及不同下游任务的基准测试验证了该数据集的有效性。
- EMNLP元学习实现零样本跨语言迁移
研究多语言应用中,如何应用元学习来提高模型性能,通过实验表明在标准的监督学习、零样本学习和少样本学习的跨语言自然语言理解任务中,元学习对于 15 种语言始终有效。
- 通用句子表示的情境镜头
本研究提出 “上下文镜头”(Contextual Lensing)方法,将通用的句子编码器分为核心的可变长度的句子矩阵表征和适应性的 “镜头”,以镜头上下文的功能诱导固定长度的向量,实现对多语言情境下语言相似性的编码
- EMNLP通用语义解析
UDepLambda 是一个语义接口,它将自然语言映射到逻辑形式,可以处理依存图,并在自然语言理解中表现出色,对于多语言问题回答有很好的性能。
- Polyglot: 多语言 NLP 的分布式词表示
使用多种语言 Wikipedia 来为 100 多种语言训练单词嵌入表示,并将其应用在词性标注中取得了与英语、丹麦语和瑞典语接近最新成果的表现。此外,通过单词分组的距离等方式,进一步研究了这些嵌入所捕获的语义特征,并将这些嵌入公开以帮助多语