- 基于通用表征的微调网络解决未知认知任务
微调预训练语言模型在广泛的任务上展现出有希望的结果,但面对新任务时,它们更依赖于通用的预训练表示还是开发全新的任务特定解决方案?我们在一个与模型相关且来自神经科学文献的情境依赖决策任务上微调了 GPT-2,并将其性能和内部机制与从头开始训练 - 启发式核心:理解预训练语言模型的子网络泛化
预训练语言模型在语法泛化方面的机制通过探索子网络和注意力机制的角度,提供了更详细的描述。
- 基于深度生成模型的满足目标条件的四连杆机构的合成
提出了基于深度学习的生成模型,用于生成满足运动学和准静态要求的多种曲柄摇杆四杆机构。该模型通过训练条件生成对抗网络(cGAN)学习了机构与链杆长度的关系,在生成多种满足特定运动学和准静态要求的不同机构方面取得了成功。
- 学习可重用操纵策略
通过单次演示和自我学习,提出了一种机器学习的框架,使机器能够获得灵活的操作技能,将其称为 “机制”。这些学习到的机制和采样器可以无缝地整合到标准的任务和动作规划器中,实现它们的组合使用。
- 人机交互中的信任修复再思考
研究旨在发现设计具备信任修复能力的机器人策略和探索成功的潜在机制,以实现对机器人信任违背的修复。该文概述了人机交互中信任修复过程的基本概念和关键组成部分,并总结了作者在该领域的发表工作。此外,还讨论了将指导未来工作的研究问题以及该研究对该领 - 关于策略无懈可击和公正选取序列的研究:第一位玩家不可全选
研究机制,序列式独裁,分配,社会福利和代理人影响的影响
- 社交网络中的 Sybil-Proof 扩散拍卖
本研究提出了两种扩散拍卖机制,即 Sybil 税机制(STM)和 Sybil 集群机制(SCM)来保护买家的利益,以抵抗 Sybil 攻击。这是第一种在单项设置下实现 Sybil-proofness 和激励兼容性的机制。
- ICLR数据增强价值的探究:关于规模定律、不变性和隐式正则化的调查
本文旨在研究数据扩展的机制,通过评估增强数据与额外真实数据之间的交换率发现,多样而不一致的增强数据可以比额外的训练数据更有价值,在小和中型训练集上,鼓励不变性的数据扩展可以比不变性本身更有价值,并证明了增强数据在训练过程中引入额外的随机性, - ICML通过演变离散化实现更快的隐私账户
本论文介绍了一个新算法,用于计算隐私随机变量的数字组成,可用于计算机制的组合的准确差分隐私参数。该算法可以在多项式对数 (k) 的时间和内存使用情况下自我组合机制 k 次。该方法不仅适用于子采样高斯机制等广泛机制的分析,还可扩展至组合同类别 - 面向算法绘画的创意过程建模
本文提出了一个基于人类创意实践的艺术画作算法计算模型框架,包括不确定的高层目标,发现新想法的探索过程以及迭代式的绘画过程等。
- 从机制到属性:等变性视角下的可识别表示学习
本文提出了一种基于机制的无监督表示学习方法,探讨了不同机制知识水平下的可辨识性问题,并研究了机制归纳偏差在提高可辨识性方面的应用。
- ACL从 COVID-19 论文中提取机制知识库
本研究旨在构建知识库,根据科学论文中的自然语言提取关于机理的信息,设计统一的架构并利用模型提取机理关系来支持 COVID-19 文献中的跨领域科学搜索。实验结果表明,该知识库在临床专家中表现优异,超过了知名的 PubMed 搜索。
- AAAI在线公平分配:一份调查报告
本篇研究论文调查了一个新兴的有前途的研究领域,这个领域考虑到许多实际的公平分配问题的在线性质。文章确定了种类繁多的这种在线公平分配问题,并讨论了适用于此在线设置的新机制和规范属性。这样的公平分配问题的在线性质提供了机会和挑战,如开发新的在线 - KDD将 Lyapunov 控制理论连接到对抗性攻击
本文提出控制理论的方法应用于对抗攻击的防御,通过建立较弱对手的证明性防御来阐明控制理论的内在价值。
- ICML学习独立的因果机制
通过模拟物理机制,我们开发出一种无监督学习的算法,能够从变换后的数据点中恢复出一组相互独立的机制,并且这些机制可以移植到新的领域中,对于迁移学习有重要的启示和应用。
- AAAI情感聊天机器:利用内部和外部记忆的情感对话生成
本文提出了 Emotion Chatting Machine(ECM),它可以生成不仅在内容(相关和语法)而且在情感(情感一致)上都恰当的响应。通过嵌入情感类别、捕捉内部情感状态的变化以及使用外部情感词汇,ECM 使用三种新机制来解决情感因 - 通过对偶理论实现次可加买家的简单机制
该论文提出了在多个项目和多个竞标人设置中的简单又近似最优机制,其中分别提到了简单的确定和支配策略激励兼备的顺序发布价格机制或带进场费的匿名顺序发布价格机制。
- 投票与设施选址
研究候选人选择机制以最小化社会成本,探讨候选人与选民在某种度量空间中的关系,颗粒度由投票机制,排名机制和位置机制决定,并且在真实情况和简化情况下量化了效率,真实性和简洁性之间的平衡。
- 差分隐私的组合定理
本文重点研究搜索不同的差分隐私机制,研究隐私水平下降的速度,并通过引入假设测试和数据处理不等式的新操作解释提出了一种解决方案,改进了现有技术并具有多方计算等多领域的应用。
- 大函数空间中的学习:基于隐私保护机制的支持向量机学习
研究了隐私保护学习中可用性或风险与统计查询处理机制提供的差分隐私级别之间的权衡,提出了针对有限维特征映射和潜在无限维特征映射的两种有效机制,并利用算法稳定性证明了差分隐私,并使用正则化经验风险最小化的光滑性证明了机制的效用。