BriefGPT.xyz
Ask
alpha
关键词
undesirable biases
搜索结果 - 3
低秩微调 LLMs:公平视角
研究表明低秩逼近 Fine-Tuning 在捕捉 Fine-Tuning 数据集从初始预训练数据分布中的转变方面具有不足之处,会产生不可忽视的副作用,包括在针对有毒模型和提供公平模型的情景下意外保留不合理的偏差和有毒行为。此外,对于顺序决策
→
PDF
a month ago
揭示生成图像检测数据集中的常见偏差:伪造还是 JPEG?
该研究讨论了使用生成图像模型检测人工内容的紧迫性,并指出当前的数据集中存在与 JPEG 压缩和图像大小相关的偏差。研究还展示了去除这些偏差对 JPEG 压缩的鲁棒性和评估检测器的不同生成器间性能的显著影响,其中 ResNet50 和 Swi
→
PDF
3 months ago
disco:生成模型分布控制的工具包
本文提出了一个名为 disco 的 Python 库,用于使分布式控制技术更容易为广大公众所使用,以解决现有语言模型和其他生成模型所遇到的不足和局限。
PDF
a year ago
Prev
Next