representational alignment | BriefGPT

关键词representational alignment

搜索结果 - 4

表征对齐支持有效的机器教学
一个优秀的教师不仅需要知识渊博，还需要以学生理解的方式进行沟通，与学生分享对世界的认知。本研究结合了机器教学和实用交流的观点，对表征对齐与教师能力促进学生学习的关系进行了量化，设计了一个区分表征对齐与教师准确性的监督学习环境，通过计算实验与
PDFa month ago
AAAI学习人类化的表示以实现学习人类价值
构建与人类价值和目标相一致的 AI 系统，防止造成伤害或违反社会可接受行为的标准是一个重要课题，本研究通过研究伦理学作为价值一方面并训练多个 ML 代理，研究其与人类的代表性一致程度与学习最具道德行为的性能之间的关系。
PDF6 months ago
代表性对齐的达成
生物和人工信息处理系统形成世界的表示，以用于分类、推理、规划、导航和决策。研究这些不同系统形成的表示在多大程度上一致？不同的表示是否仍然可以导致相同的行为？系统如何修改其表示以更好地匹配另一个系统的表示？研究表示对齐的这些问题是当代认知科学
PDF9 months ago
与人类表征的对齐支持强大的少样本学习
通过信息理论分析和计算机视觉模型的实验，我们发现 AI 系统的世界表示与人类的相似度呈现 U 形关系，并表明高度相似的模型在少量数据、对抗攻击和领域转换方面更具鲁棒性和泛化能力，表明人类对齐通常是模型充分利用有限数据、鲁棒性和良好泛化的足够
PDFa year ago