- Bi-DCSpell: 一个双向检测 - 纠错交互框架用于中文拼写检查
中国拼写检查(CSC)旨在检测和纠正中文句子中可能存在的拼写错误字符。本文提出了一种双向检测 - 纠正框架(Bi-DCSpell),通过引入交互学习模块促进检测和纠正之间的双向特征交互,以改善它们的表示学习,从而在广泛使用的基准数据集上展示 - 从零开始照看语言模型:通过试验和演示进行交互式语言学习
通过系统性可控实验,我们研究了互动交互对神经语言学习的影响,发现通过教师示范和学生尝试,互动式语言学习有助于语言模型的词汇学习效率提高。
- 从用户编辑中学习潜在偏好,使 LLM 代理人保持一致
基于用户编辑的互动学习语言代理,通过历史编辑数据推断用户的潜在偏好,定义推动未来回复生成的提示策略,实现代理和用户偏好的对齐,减少用户编辑成本和提高性能。
- 具近见式指导反馈的可证明交互式学习
探讨了以回顾性标签为指导的交互学习,通过理论分析证明了任何算法的后悔度必须与代理的响应空间的规模成比例,并基于低秩矩阵的特殊设定引入了名为 LORIL 的算法,并证明了它的后悔度与回合数的平方根成比例,而不以代理的响应空间的大小为依据,最后 - SOTOPIA-$π$: 社交智能语言代理的交互学习
通过行为克隆和自我强化训练,我们提出了交互学习方法 SOTOPIA-π,进一步提高语言代理的社交智能。我们展示了该训练方法使得一个 7B LLM 达到了专家模型(基于 GPT-4 的代理)的社交目标完成能力,同时提高了语言代理的安全性并在 - ImageLab:为初学者和专家简化图像处理探索
这篇论文介绍了一种名为 “ImageLab” 的新型工具,旨在通过优先考虑交互式学习而不是理论复杂性,填补技术专家以外的用户之间的知识差距,从而使图像处理更加平等、可靠。该工具不仅作为有价值的教育资源,还提供了一个实践环境供经验丰富的从业者 - 一种用于自动化 3D 医学图像分割的动态交互学习框架
基于深度学习的医学图像自动分割系统面临大量数据标注成本和模型迭代中的高延迟问题,本研究提出了一种动态交互学习框架,通过将交互式分割与端到端弱监督学习和流式任务集成,解决了这些挑战。我们开发了新颖的重放和标签平滑方案,克服了灾难性遗忘并提高了 - 交互式估计的统一模型和维度
本文提出了交互式学习的抽象框架 —— 交互估计,其中目标是通过学习者查询的点与其类似性来估计目标。我们介绍了一种称为不相似维度的组合度量,从很大程度上捕获了我们模型中的可学习性。我们提出了一种简单、通用和广泛适用的算法,对其进行了后悔和 P - 从交互式到共建式任务学习
研究机器人的交互学习过程,探究在类似于父母和孩子之间的共同建构过程中,利用脚手架和先前共同经验来帮助机器人从非专业用户那里学习,从而为机器人的学习提供新的思路和方向。
- 联合红外可见光图像融合和显着性目标检测的交互增强范式
本文提出一种基于红外和可见光图像的交互式多任务范式,通过特征筛选的融合子网和融合引导的交叉互补 SOD 子网相结合,进行物体定位和探测,同时提出交互式循环学习策略,以实现这两个任务的互相增强,取得了显著的效果。
- 多层交互对比学习在知识感知推荐中的应用
本文提出了一种基于对比学习的知识感知推荐模型,结合了本地和非本地的知识图谱,并采用层级交互对比学习来提高推荐性能。
- 使用信号时间逻辑从自然语言和演示中进行交互式学习
该研究介绍了一种交互式学习方法,能够从自然语言描述中学习正确、简洁的统一信号时序逻辑公式,并使用深度 Q 学习算法确定机器人的最优控制策略。
- 机器教学中的人工智能交互设计
本文基于现有工作,提出了一个包括教学界面、机器学习器和知识库在内的机器教学框架,并着重关注实现教学界面所涉及的人工智能交互设计。在师生对话中,阐述了开发机器教学系统时需要处理的设计决策。
- ICLR部件 - 原型网络概念级调试
本文介绍了一种基于概念的分类器 Part-prototype Networks 和其调试工具 ProtoPDebug,旨在提高模型的可解释性和准确性。实验证明,ProtoPDebug 比现有调试工具更有效,可用于关键应用中的互动学习。
- IGLU Gridworld:用于具有体态对话代理的简单快速环境
本文提出了 IGLU Gridworld 环境,以便于建立和评估具有语言约束的智能体的强化学习过程,该环境具有视觉实体特征、交互式学习、语言约束的强化学习以及组合难度大的任务空间。
- 透过指引提炼的可教授强化学习
本研究提出了一种基于 “可教学” 的决策系统的交互式学习监督范式,能够通过学习外部教师提供的结构化建议,解决复杂任务的学习难度,对拼图、导航和运动等各种任务需求的人工干预也相对较少。
- 提升排序模式学习
本文提出一种使用多准则决策制定方法学习模式排名功能的方法,其中将不同的趣味度度量聚合成单个加权线性排名函数,使用交互式学习过程。该方法基于层次分析过程(AHP)和一组用户排名的模式来构建偏好矩阵,比较根据用户特定趣味度而言的测量的重要性。在 - 交互式机器学习:图像字幕生成
本文提出了一种交互式学习的图像标题生成模型,该模型使用数据增强方法来扩大人类反馈所提供的有效学习信息,并智能地将其集成到模型中,本文重点讨论了其反馈收集、数据增强和模型更新三个关键组件的实现方法。
- AAAI有效可靠的结构化输出概率交互学习
本文研究基于交互式的学习方式,探讨以 active learning 和 skeptical learning 为主要方向的标签未知和标签噪音的情况下,采用确保可靠和高效运算的具有表现力的概率模型来衡量不确定性,在此条件下,我们研究认证了一 - 交互式决策的统计复杂度
提供决策 - 评估系数,作为评估交互式学习复杂度的量,从而实现与样本效率无关的最佳后悔,同时引入了一种新的选择 Estimation-to-Decisions(E2D),使得监督学习的算法适应于在线决策,从而实现了准确的与样本效率无关的学习