BriefGPT.xyz
大模型
Ask
alpha
关键词
harms
搜索结果 - 4
自由放任的危害:生成式语言模型中的算法偏差
通过开放式提示,我们发现模型产生的文本在描绘边缘群体的身份时存在错误、隐含和刻板印象的问题,这些问题可能导致心理伤害和认知能力下降。
PDF
3 months ago
生成 AI 应用中负责任 AI 危害自动测量框架
我们提出了一个框架来自动化测量大型语言模型(LLMs)和相关产品与服务的负责任人工智能(RAI)指标。该框架基于现有的技术和社会技术专业知识,并利用了最先进的 LLMs(如 GPT-4)的能力来自动测量 LLMs 可能违反一系列 RAI 相
→
PDF
8 months ago
自然语言处理中偏见和伤害的度量
该研究提出了有关 NLP 技术中有关社会偏见的框架和一系列问题,并且通过几个案例研究来验证了我们的框架和记录问题。
PDF
3 years ago
POTs:保护性优化技术
本文对算法公平实现的局限性进行了分析,并提出了一种保护性优化技术 (POTs) 的解决方案,该方案可以扩大政治争议的渠道,并可以纠正、转移或暴露系统对人口及其环境造成的危害。
PDF
6 years ago
Prev
Next