- 文本扩展基准:数据集、度量和基准线
本文提出了文本扩展(TE)的新任务,旨在插入细粒度修改器到纯文本的适当位置以具象化或使人类写作更生动。通过四种互补方法,我们构建了一份包含 1200 万个自动生成实例和 2000 个人工注释的英文和中文数据集。为了便于自动评估,我们从多个角 - 脑肿瘤分割的分割模型
评估了 Segment Anything Model (SAM) 在脑肿瘤分割上的性能,发现 SAM 与目前的最先进模型之间仍存在差距。
- 图像专利检索的高效表示学习
基于专利绘图图像的特征,本文提出了一个简单轻量级的模型,用于专利检索,在大规模基准测试上表现显著优于其他方法,均值平均精度(mAP)得分提高了 33.5%,进一步实验证明此模型能够精确扩展以达到惊人的 93.5% 的 mAP,此方法在 EC - ZC3:零样本跨语言代码克隆检测
本文提出了一种名为 ZC3 的新方法,用于零射击交叉语言代码克隆检测,通过对比片段预测、领域感知学习和循环一致性学习来生成在不同编程语言之间对齐且区分不同克隆类型的表示,实验证明 ZC3 相对于现有基准模型在 MAP 评分上分别提高了 67 - Cabrita:弥合外语鸿沟
通过使用 Portuguese 文本对 3-billion-parameter 模型进行连续预训练,本研究提出了一种名为 Cabrita 的方法,成功解决了性能和高效标记化问题,并以可负担得起的成本实现。
- 一个参数高效的多主体模型用于预测 fMRI 活动
该研究报告介绍了团队 “BlobGPT” 在 Algonauts 2023 比赛中的提交结果,他们提出了一种由预训练主干模型与多学科线性编码头组成的模型,详细阐述了多个组件及相关实验结果。
- 实现有效的古代中国翻译:数据集,模型和评估
我们提出了针对古代汉语的《尔雅》翻译方法,该方法通过从各种来源收集、清理和分类古代汉语材料,形成迄今为止最广泛的古代汉语资源。我们设计了两个同时运作的任务:双音节对齐替代(DAS)和双层掩蔽语言模型(DMLM)。在不同场景下,我们建立了基准 - 应用情感分析辅助不同类型的 LSTM 模型对股票价格预测模型的效率对比
本文研究旨在找到最佳模型利用公司预测数据和行业表现以及相应公司的情况来准确预测股权股价的短期和长期目标。
- 多语言可控变压器模型词汇简化
提出了一种基于 Transformer 的多语言可控词汇简化系统,使用语言特定的前缀、控制标记和候选词从预训练的掩蔽语言模型中提取较简单的替代词,该系统在三个公开的词汇简化数据集上优于之前的最先进模型,表现良好。针对最近的 TSAR-202 - ICML测试时间风格转移:处理领域通用中的任意风格
本文提出了测试时样式转换和样式均衡方法以解决域泛化中的模型训练与目标域未知的问题。在不需要进一步模型更新的情况下,通过这种方法,模型可以处理任意具有任意样式统计数据的目标域,并且已在不同数据集上得到实验证明其有效性。
- 使用图像变换器和镜头元数据嵌入转换背景虚化效果
本论文提出了一种新的通用方法,在模型中嵌入镜头元数据,并引入了一种来自新发布的 Bokeh Effect Transformation Dataset(BETD)[3] 的 alpha masks 的损失计算方法。基于以上技术,我们提出了 - 建模个人叙述中的共情相似性
本篇研究提出一种基于共情共鸣的个人故事相似度计算方法,通过对个人故事中的主要事件、情感轨迹和总体价值等三个特征进行操作来得出共情相似度得分,并使用 1500 个故事和 2000 对故事进行了数据集制作与模型的训练,最终证实了基于共情的相似度 - ACL响应条件的交替预测
本文提出一种模型,该模型将对话历史和下一个讲话者想要说的内容作为条件来预测对话的结束,比基线模型在各种指标上的表现更好。该模型可作为一个增量响应排名器,在各种场景中得到应用。
- 芝加哥市预测特定犯罪类型的多种方法的比较分析
本文研究犯罪现象受到生理、社会和经济等因素影响,特别是针对通过时空信息预测盗窃这一单一犯罪案件的时空模型和不同算法进行探究,其中 XGBoost 算法表现最优,F1 分数为 0.86。
- 使用现成的机器学习工具,以超过 99% 的准确率区分作者身份:ChatGPT 还是学术科学家?
通过监督分类的方法,我们开发了一种方法来辨别人工智能生成的文本和学术科学家的文本,其中包含 20 个特征,最终建立了一个模型准确地判断了文本的作者,使得误分类文档的数量减少至原来的 1/20。
- MM分布偏移下测试时间适应的综合调查
本次研究调查了测试时间适应(TTA)在机器学习中的应用与优化方法。针对不同的学习场景,研究紧分测试时间领域适应、测试时间批适应、在线测试时间适应和测试时间先验适应四类,总结了高级算法的分类方法,探讨了 TTA 的应用与未来研究的挑战。
- 人机信任问卷的元分析:趋同性度量与新兴模型
这篇论文通过对多个经过验证和可靠的人机互动信任测量工具的元分析,提出了一个一致的人机互动信任模型,为今后的研究提供了一个综合框架,并确定了信任测量的边界和需进一步调查的领域。
- GLEN:适用于数千种类型的通用事件检测
本论文提供了一个实用的通用事件检测数据集 GLEN,它使用了现有注释的 PropBank 作为远程监督,提出了一个新的多阶段事件检测模型,能够有效处理大本体大小和标签噪声问题,并在性能上表现出优越性。
- CVPRActMAD: 用于测试时间训练的激活匹配以对齐分布
本文提出了基于 Activation Matching(ActMAD) 实现的 Test-Time-Training(TTT)方法,通过分析神经网络的激活函数并调节其分布,来实现对测试数据及时的辨识和适应。与现有的方法不同的是,ActMAD - VER: 为实体和关系生成自然语言表示的学习方法
本文提出了 VER 模型,旨在利用自然语言描述实体之间的关系。该模型能够生成描述实体和实体关系的高质量句子,并为定义建模、关系建模和生成通用常识推理等任务提供了便利。