- 在线神经回归的上下文强化学习
使用神经网络在在线回归任务和相关神经上下文盲目策略中展示了新的调整方法以减小后悔并通过实验证明其性能优于现有算法。
- 文本处理对表格数据的分类
自然语言处理技术在过去十年中取得了巨大的进展。本文提出了一种新颖的框架,基于文本的分类 (TBC),它利用最先进的文本处理技术来解决表格数据上的分类任务。我们提供了一组受控实验,展示了使用这种方法相对于其他分类方法的优势。在几个数据集上的实 - mlscorecheck:测试机器学习中报告的性能分数和实验的一致性
通过验证报告的实验结果来解决人工智能中的可复现性危机是一项具有挑战性的任务,为了促进对报告结果的验证,我们开发了数值技术,能够识别在机器学习问题中,包括二元 / 多类别分类和回归分析中,报告的性能得分与各种实验设置之间的不一致性,这些一致性 - 基于认知维度的篇章关系分类和跨框架篇章关系分类的实证研究
我们展示了讨论关系可以通过 Sanders 等人(2018)提出的一些简单的认知启发维度来有效地捕捉,通过这些维度,在框架之间传递讨论关系的知识是可能的,尽管两个框架在讨论划分上存在差异,这证明了这些维度在描述跨框架的讨论关系时的有效性,并 - 新的布尔可满足性问题启发式策略:最小正负乘积策略
本研究提出了一种名为 “Minimal Positive Negative Product Strategy” 的新型启发式算法,用于指导 CDCL 算法解决布尔可满足性问题,它通过数学解释阐明了该算法相对于动态最大个体和变量状态独立衰减和 - 一手抓握多个物体
该论文介绍了 MultiGrasp,一种用于多指灵巧机械手在桌面上进行多物体抓取的两阶段方法,包括生成抓前提案和执行抓取举起物体。实验结果主要集中在双物体抓取,并报告了 44.13% 的成功率,展示了对未见物体配置和不精确抓取的适应性。该框 - EMNLPChatGPT 增强的多阶段预训练用于多场景多领域对话摘要
我们提出了一种特定于多场景多领域对话摘要的新型预训练模型,它采用多阶段预训练策略来缩小预训练目标和微调目标之间的差距。实验结果表明,我们的预训练模型在完全微调、零样本和少样本设置下,显著优于先前的最先进模型。
- 简洁有序的感知促进大型语言模型进行演绎推理
通过引入 Concise and Organized Perception (COP) 方法,可以高效地分解复杂的演绎问题并消除冗余信息,从而在与之前的方法相比表现显著优异的同时,减少错误推理的风险。
- 通过准确度预测器修剪大型语言模型
基于新的剪枝方法与准确度预测模型,本研究提出一种能够自动选择最佳模型的压缩方法,实验证明其有效性和高效性。相较于基准模型,Wikitext2 和 PTB 上的困惑度分别降低了 9.48% 和 5.76%,而平均 MMLU 准确度提高了 6. - ICCVMetaGCD:泛化类别发现中的持续学习
我们提出了一种名为 MetaGCD 的方法,使用元学习框架和基于邻域的对比网络,实现了在已知类别中持续发现新类别的能力,并通过实验结果展示了该方法的优越性。
- 主动多域适应的动态域间差异调整
多源无监督领域适应(MUDA)旨在将相关源领域的知识转移至无标签的目标领域。本文提出了一种名为动态领域差异调整的主动多领域适应方法(D3AAMDA),通过建立多源动态调制机制和多源主动边界样本选择策略(MABS)来解决 MUDA 方法的问题 - 利用红外编码图像增强低光照图像
提出了一种通过去除相机红外 (IR) 截止滤波器来提高低光环境下图像可见度的新方法,实验结果定量和定性上显示了提出方法的有效性。
- KoRC:面向深度文本理解的知识导向阅读理解基准
利用大量知识库指导注释者或大型语言模型构建知识型问题,采用知识库中的标签作为最终答案,验证了目前最强基准模型在处理深入文本理解方面的性能仍然相对较低。
- 基于参考图的运动模糊去除:学习如何利用参考图像的锐度
使用多个图像进行去模糊处理的新方法,通过匹配目标图像和参考图像的局部块并融合其特征来估计清晰图像,实验证明了该方法的有效性。
- 医学视觉问答中的本地化问题
文章提出了一种针对医学图像的视觉问答模型,该模型能够考虑上下文并回答关于图片区域的问题,实验结果表明该方法在三个数据集上优于现有方法。
- IJCAI基于规范伦理理论的理论导向道德人工智能:聚合模型的道德人工智能
本文实现了 Maximizing Expected Choiceworthiness 算法,结合三种规范伦理理论为基础,生成最合适的输出,通过实验结果表明,MEC 算法能够在道德不确定性下制定出合适的道德判断,且能够产生与常识道德相对应或者 - 利用 MaxSAT 求解器的配置
本篇论文探讨了如何利用 MaxSAT solver 的不同参数配置并进行实验,特别地,我们将多种非竞争性求解器配置相结合以获得更好的解决方案。
- 层级激活机制
本文提出了一种新颖的激活机制,名为 LayerAct 函数,该函数能够更好地应对输入的波动和噪声,同时在保持零输出均值的同时,实现比传统的元素级激活函数更好的噪声鲁棒性,实验结果表明,这些函数在处理噪声图像数据集方面表现出色,同时在大多数情 - MM通过具有稳定和支持模型的逻辑程序捕获(最优)松散计划
我们在删除自由计划和逻辑编程之间建立了新的关系,并采用逻辑程序的稳定模型来捕捉问题的所有行动子集,从而实现松弛计划问题的求解,同时,我们使用实验结果证明了这种方法能够提供更好的性能。
- 使用语音单元的可懂嘴唇合成
本文提出了一种新型 Lip-to-Speech 合成(L2S)框架,采用量化的自监督语音表示作为 L2S 模型的另一个预测目标,从而实现了强内容监督的多目标 L2S 模型训练,并介绍了一种多输入声码器用于准确地将合成的梅尔频谱转换为波形,并