- 一种基于人工比较的概率对齐方法
探究人类比较对传统监督微调过程的改善条件,提出一种连接机器学习和人类反馈的两阶段框架,并利用概率二分法通过学习低维表示和使用人类比较来改善模型对齐,进而减少样本复杂度,实验证明该框架在降噪数据和高维模型中的优势。
- ICML量化人类对社交和导航网络的先验
这项研究利用图的组合结构来量化人类对隐含关系数据的先验知识,实验重点关注社交互动和空间导航领域,并发现推断出的先验知识具有一定的一致性和特定领域特征,从而展示了如何利用非经典的统计分析方法高效地建模数据中的潜在偏见。
- 基于知识注入的图像分类网络增强方法
基于人类知识的深度神经网络训练方法通过使用人类认知模型构建深度神经网络训练模型,采用现有人类知识信息构建了多级分层深度学习算法,并有效解释了神经网络的隐藏信息。
- 基于知识的科学出版物知识图谱的优化
我们将作者识别问题视为知识图谱的构建和精细化问题,并通过学习概率逻辑模型从人类指导中学习关系回归树,以可解释规则输出。人类知识以一阶子句的形式注入以精炼树,且我们在七个作者领域定量和定性地展示了人类知识的实用性。
- MLCopilot: 大型语言模型在解决机器学习任务中的应用
本文介绍了一种利用 LLMs 自动学习生成机器学习解决方案的框架 MLCopilot,旨在将机器智能与人类知识相结合来提高解决新任务的能力,生成的解决方案可以直接应用于实际环境中。
- 语言模型对推理的人类内容效应展示
大型语言模型在抽象推理任务上表现优秀,但与人类推理问题存在相似的缺陷,同时受到人类知识和信仰的影响,使用可信的现实情境方案进行推理可以提高推理质量,这种关联性帮助我们了解认知效应和语言模型表现的因素。
- 使用 GPT-3 生成的对象概念的语义特征
通过探究 GPT-3 生成的语义特征,以及这些特征与通过人工选择实验得出的特征列表之间的共同点,此项研究证实了使用大型语言模型自动生成可解释特征集的潜力,并且扩大了各种心理和语言研究中语义特征的使用范围。
- AlphaZero 中的国际象棋知识获取
本文提供证据表明,AlphaZero 神经网络在学习国际象棋时获得了人类知识,并探究了其在象棋中开局游戏方面的行为分析和表示分析。