大型语言模型中情感和语言模型的融合，用于道德合规

May, 2024

大型语言模型中情感和语言模型的融合，用于道德合规

Integrating Emotional and Linguistic Models for Ethical Compliance in Large Language Models

Edward Y. Chang

TL;DR这项研究开发了用于大型语言模型（LLMs）更好地管理与情感和伦理有关的语言行为的先进方法。我们引入 DIKE，这是一个对抗性框架，可以增强 LLMs 内化和反映全球人类价值观的能力，以适应不同的文化背景，以促进用户之间的透明度和信任。该方法涉及情感的详细建模，语言行为的分类和道德保护栏的实施。我们的创新方法包括使用自监督学习技术将情感和行为进行映射，通过对抗性审查来完善这些道德保护栏，并系统地调整输出以确保道德一致性。该框架为具有道德完整性和文化敏感性的 AI 系统建立了坚实的基础，为更负责任和与环境相适应的 AI 交互铺平了道路。

Abstract

This research develops advanced methodologies for large language models (LLMs) to better manage linguistic behaviors related to emotions and ethi

large language models ethics dike emotions ethical integrity

发现论文，激发创造

利用大型语言模型建模情绪与伦理

本文探讨了如何将类人情感和伦理考虑整合到大型语言模型（LLM）中，并通过协作式 LLM 对八种基本人类情感进行建模，以及通过自我监督学习算法与人类反馈指导在 LLM 中嵌入潜在的伦理维度。利用该方法，LLMs 能够进行自我评估和调整以符合伦理准则，并提高其生成与情感共鸣和伦理一致的内容的能力。所提出的方法和案例研究展示了 LLMs 超越纯文本和图像生成，进入共情互动和有原则决策领域的潜力，并在情感意识和伦理意识的 AI 系统发展中树立了新的范例。

Apr, 2024

从长期存在的问题到新兴的困境剖析大型语言模型的伦理

本文全面调查了与大型语言模型（LLMs）相关的伦理挑战，从长期存在的问题，如侵犯版权、系统性偏见和数据隐私，到新兴问题，如真实性和社会规范。我们批判性地分析了现有研究，旨在理解、审查和减轻这些伦理风险。我们的调查强调了将伦理标准和社会价值融入 LLMs 的开发中，从而引导负责任和道德对齐的语言模型的发展。

Jun, 2024

加强人工智能中的道德界限：提升大型语言模型安全的高级策略

通过引入多方面的方法，包括过滤敏感词汇、检测角色扮演、实施自定义规则引擎和扩展到各种大型语言模型衍生物，我们解决了大型语言模型在道德、安全和隐私方面的挑战，并且保持了高性能。这项研究为平衡问答系统的效率与用户隐私和道德标准提供了一个框架，确保了更安全的用户体验并增加了对 AI 技术的信任。

Jan, 2024

LLM 伦理导航：进展、挑战和未来方向

本研究探讨了人工智能领域中大型语言模型（LLMs）的伦理问题。它讨论了 LLMs 和其他人工智能系统所面临的常见伦理挑战，如隐私和公平，以及 LLMs 特有的伦理挑战，如幻觉、可验证的问责和解码审查复杂性。该研究强调了解决这些复杂性的必要性，以确保问责制、减少偏见并增强 LLMs 在塑造信息传播方面所扮演的重要角色的透明度。它提出了缓解策略和 LLM 伦理的未来发展方向，主张跨学科合作。该研究建议针对特定领域制定伦理框架，并根据不同环境调整动态审计系统。这一路线图旨在引导负责任地开发和整合 LLMs，设想一个以伦理考虑为基础的人工智能进步的未来社会。

May, 2024

法律领域中法学硕士课程的评估伦理

大型语言模型在法律领域的适用性和性能的综合评估对学术讨论具有重要贡献。

Mar, 2024

应用标准推进大型语言模型的上下游伦理

本文探讨了 AI 所有者如何通过借鉴其他内容创作行业的行为准则和伦理标准来为 AI 生成的内容开发保障措施，并通过剖析 LLMs 内容生成机制，确定了四个关键领域，即上游 / 下游和用户提示 / 回答，在这些领域中可以有效地应用保障措施，同时包括一个比较分析这四个区域，并评估现有的伦理保障措施在成本、有效性和与行业实践的一致性方面的情况。本文的核心观点是，现有的 IT 相关伦理准则虽然适用于传统的 IT 工程，但对 LLM 生成内容所带来的挑战来说是不足够的。最后，突出强调上游数据集整理和下游伦理基准之间的潜在利益冲突，强调需要进行更广泛的评估，并针对在这个快速发展的内容生成领域中的伦理影响展开细致的对话。

Jun, 2023

大型语言模型与社会机器人交叉领域的伦理考虑的实证设计公正方法

将大型语言模型 (LLM) 与社交机器人整合在一起存在一系列独特的伦理挑战和社会影响。本研究旨在识别这两种技术结合时出现的伦理考虑。使用 LLM 进行社交机器人可能带来益处，如实现自然语言开放领域对话。然而，这两种技术的交叉也引发了与错误信息、非语言线索、情绪干扰和偏见有关的伦理关注。机器人的物理社交化特征增加了复杂性，因为基于 LLM 的社会人工智能的伦理危害，如幻觉和错误信息，由于物理社交化对社会知觉和交流的影响，可能会更加严重。为了解决这些挑战，本研究采用了一种基于实证设计正义方法的方法，重点关注通过定性共同设计和交互研究以识别社技术伦理考虑。研究的目的是识别与 LLM 作为人形社交机器人界面的共同设计和交互过程相关的伦理考虑，并评估在 LLM 和社交机器人设计交叉领域中如何使用设计正义方法。研究结果揭示了在四个概念维度中出现的伦理考虑的映射：交互、共同设计、服务条款和关系，并评估设计正义方法在 LLM 和社交机器人交叉领域中的实证运用。

Jun, 2024

利用大型语言模型进行道德教育与发展研究的潜在益处

本文回顾了最近发表的关于 LLMs 在道德教育和发展研究中的问题，涵盖了 LLMs 的新功能特性，如情境学习和思维链以及在解决伦理困境时的表现及其潜在意义和影响。

Jun, 2023

探索和引导大型语言模型的道德罗盘

该研究对最先进的大型语言模型进行了综合比较分析，评估了它们的道德特性，发现专有模型主要以功利主义为基础，而开源模型更符合价值伦理学；另外，通过道德基础问卷，除了 Llama 2 外，所有被调查模型都显示出明显的自由主义偏见；最后，为了对其中一个研究模型进行因果干预，提出了一种新颖的相似性激活引导技术。通过该方法，可以可靠地引导模型的道德观达到不同的伦理学派别。所有这些结果表明，已经部署的大型语言模型存在一个常常被忽视的道德维度。

May, 2024

AI 法案与大型语言模型（LLMs）：关于重要问题和隐私影响时需要人类和道德监督

人工智能系统和大型语言模型的迅猛发展使得有必要评估它们在隐私保护、个人数据保护以及伦理层面上对最弱和最脆弱群体可能产生的风险和影响。本研究聚焦于人类监督、伦理监督和隐私影响评估。

Mar, 2024