关键词benchmark evaluation
搜索结果 - 18
- Disce aut Deficere:评估 LLMs 对 INVALSI 意大利基准的熟练度PDF7 days ago
- NYC 室内长期视觉地点识别数据集与半自动标注PDF3 months ago
- 基于法语的临床命名实体识别性能评估PDF3 months ago
- 面向麻醉学的中文大型语言模型训练PDF4 months ago
- 当基准成为目标:揭示大型语言模型排行榜的敏感性PDF5 months ago
- 第四届神经网络验证国际比赛 (VNN-COMP 2023):概述与结果PDF6 months ago
- UHGEval:通过无约束生成对中国大型语言模型的幻觉进行基准测试PDF7 months ago
- 基于卷积和 Transformer 的视频帧插帧网络PDFa year ago
- 如何训练一款基于多模态输入的 GPT4 风格语言模型?PDFa year ago
- DUBLIN -- 语言 - 图像网络理解文档PDFa year ago
- 使用对比式 3D 人体动作合成进行文本到动作的检索PDFa year ago
- AAAI面向对话 AI 的常识推理:现有技术综述PDFa year ago
- EMNLPDial2vec: 自导对比学习非监督对话嵌入PDF2 years ago
- ACL用 FIRE 对抗火灾:评估文本到视频检索基准的有效性PDF2 years ago
- ECG 生物特征识别:评述、系统提出和基准评估PDF2 years ago
- 基准测试可解释性人工智能的反事实算法:从白盒到黑盒PDF2 years ago
- EvidentialMix: 结合开放集和封闭集噪声标签的学习PDF4 years ago
- TriGAN:多源域适应的图像到图像翻译PDF4 years ago
Prev
Next