域间可信度表征学习

Aug, 2023

Trustworthy Representation Learning Across Domains

Ronghang Zhu, Dongliang Guo, Daiqing Qi, Zhixuan Chu, Xiang Yu...

TL;DR我们提出了第一个跨领域可信度学习框架，它包括鲁棒性、隐私、公平性和可解释性等四个概念，在这个研究方向上进行了全面的文献综述，介绍了框架的细节以及基本概念和现有方法，并对未来的研究方向进行了洞察和讨论。

Abstract

As ai systems have obtained significant performance to be deployed widely in our daily live and human society, people both enjoy the benefits brought by these technologies and suffer many social issues induced by these systems. To make →

ai systems trustworthy ai systems representation learning cross domain scenarios framework

发现论文，激发创造

可信分布式 AI 系统：鲁棒性、隐私和治理

新兴分布式人工智能系统通过稳健性保证、隐私保护和公平意识在分布式学习中改善了安全、隐私和公平的问题。本文提供了分布式学习的不同架构概述、围绕对抗攻击、隐私保护和公平治理的对策分类，并讨论了面临的挑战和未来研究方向。

Feb, 2024

表示学习：综述与新视角

本文回顾了无监督特征学习和深度学习领域中的最新进展，讨论了学习良好的数据表示的适当目标，以及表示学习、密度估计和流形学习之间的几何联系。

Jun, 2012

信任 AI 与可信机器学习技术之间的关系

本研究提供了一种系统的方法来将社会科学信任概念与建立在人工智能服务和产品上使用的机器学习技术相关联，探讨了四种类别的机器学习技术 (公平性、可解释性、可审计性和安全性) 如何影响人们的信任，并介绍了在 AI 系统生命周期的不同阶段建立信任的技术需求。

Nov, 2019

建立值得信赖的人工智能的关键：从 AI 原则，伦理，关键要求到负责任的 AI 系统和监管中去连接关系

提出了可信人工智能的七个技术要求和三个主要支柱的构建方法，并考虑到了系统整个生命周期中的所有过程和角色的可信性。同样，还介绍了通过审核过程提高人工智能系统的责任的概念，以及为了未来社会进步而必须面对的规制辩论。

May, 2023

不要信任，总是验证：可信 AI 的路线图？

本文对基于人工智能技术的系统的可验证性与数据存在的偏差问题进行了讨论，并提出了可信 AI 所需满足的一些属性和模型。

Jun, 2022

学习人类化的表示以实现学习人类价值

构建与人类价值和目标相一致的 AI 系统，防止造成伤害或违反社会可接受行为的标准是一个重要课题，本研究通过研究伦理学作为价值一方面并训练多个 ML 代理，研究其与人类的代表性一致程度与学习最具道德行为的性能之间的关系。

Dec, 2023

值得信赖的人工智能：计算视角

本文从计算的角度综述了 AI 可信赖性的最新技术，其中包含了六个方面：安全、非歧视与公平、可解释性、隐私、责任与审计能力以及环境福祉，旨在帮助读者理解可信赖 AI 的最新技术以及现实系统的应用。

Jul, 2021

可信联邦学习：综述

本文介绍了联邦学习的可信度问题，并提出了可信度的三个支柱：可解释性、公平性和安全性与隐私性。通过对当前状态的分析和评估，提供了一个综合的可信度结构和信任评估机制。

May, 2023

为开发更可信赖的自主系统建议重视 RE

该论文关注了 COMPLYING WITH THE EU AI Act 准则并开发实施 AI 系统的情况，分析了不同伦理准则的文献细节、伦理 AI 框架的适用性等问题，提出了伦理 AI 的限制以及进行可靠的 AI 开发的建议

May, 2023

AAAI FSS-19: 人性化人工智能：人工智能模型和数据的可信度研究论文集

研究旨在提高人工智能系统的可信度和信任度，开发能够适应实际应用场景的人工智能系统，并将人类放在其中心地位，使其能够有效地使用系统，理解输出和解释结果以满足监管委员会的要求。

Jan, 2020