- 通过投票实现毒性分类
通过整合投票和思维链过程的数据集创建机制,本研究提出了一种高质量的开源数据集用于检测有毒内容。这种方法不仅确保了每个样本的多样化分类指标,还包括分类得分和解释性推理。我们利用通过我们提出的机制创建的数据集来训练我们的模型,并将其与现有的广泛 - 在资源受限的边缘设备上部署 LLMs 的实践指南
通过对学习方法、个性化数据使用量、语言模型的类型和大小、压缩方法以及学习时间和目标用例难度之间的权衡进行实证研究,我们找到了一些用于将语言模型部署到资源受限设备上的指导方针。
- VIP: 基于多模态大型语言模型的多功能图像外描绘
本文介绍了一种新颖的图像外延框架,利用多模态大语言模型(MLLM)自动提取和组织给定图像的遮罩部分和非遮罩部分的文本描述,并利用特殊的交叉注意力模块(CTS)增强图像的特定空间区域与文本提示部分之间的交互作用,从而实现了图像外延结果的定制化 - 示范而非说明:用示范反馈来对齐语言模型
通过使用在线比较数据与用户示范作为反馈,DITTO 方法通过设置少量示范来将语言模型输出与用户的行为对齐,有效地进行语言模型的个性定制。
- 基于层次概率模型的无监督工作行为模式提取
提出了一种新的基于高斯过程半马尔可夫模型的工人行为模式提取方法,不需要预先训练,能够自动准确地将连续运动划分为不同的运动类别,并与隐马尔可夫模型进行参数互推,以实现准确的运动模式提取。该方法在实际生产现场的工人装配产品的运动数据上进行了验证 - GraCo:可控粒度的交互分割
我们介绍了一种名为 Granularity-Controllable Interactive Segmentation(GraCo)的新方法,通过引入额外参数来精确控制预测粒度,增强了交互系统的自定义性,消除了冗余并解决了模糊性。我们设计了 - BlendScape: 通过生成式人工智能实现统一和个性化视频会议环境
通过 AI 图像生成技术,BlendScape 系统支持用户自定义视频会议环境以满足他们的协作需求,通过融合用户的背景和多模态交互技术,用户能够快速表达设计意图并在未来会议中构建协作结构,但同时也遇到了防止分散注意力的挑战。
- 大规模语言模型的在线训练:聊天中学习
大型语言模型 (LLMs) 在自然语言处理 (NLP) 领域产生了巨大的革命,提供了引人注目的功能,得到了广泛的使用。然而,现有的 LLMs 与用户之间的交互范式存在着局限性、定制能力不足或者缺乏持续学习的问题。为了克服这些挑战,本文介绍了 - AI 工作流程的效用和定制的纵向研究
通过一项为期三周的纵向研究,我们发现熟悉化阶段持续了 4.3 个会话,用户探索了工作流的功能以及他们发现的有用之处。在熟悉化后,系统的感知效用得分高于之前,表明人们对于人工智能的感知效用并非仅仅是新奇的效应。系统的增益主要来自于最终用户能够 - 关于行为使用条款的标准化及其用于负责任人工智能许可的采纳
AI 技术的风险管理工具 ——《负责任 AI 许可证》的采纳、适配以及规范化定制的必要性及支持方式。
- 评估 200 + 定制 GPT 的提示注入风险
本文提供了一份对 AI 自定义 GPT 模型中提示注入的分析,并评估了此类攻击的可能缓解措施,结果强调了在设计和部署可定制的 GPT 模型时迫切需要强大的安全框架,以确保 GPT 定制化的好处不会以安全和隐私的牺牲为代价。
- KDD图变分嵌入协同过滤
推荐系统中,通过使用图卷积网络中的变分嵌入进行预训练,取得了改善特征传播的效果,进而提高回忆率和归一化折现累积增益指标。
- 一个尺寸并不适合所有人:个性化定制开放领域的流程
首次研究了 LLMs 能够多大程度上个性化定制开放领域的操作过程,使用 CustomPlans 数据集作为个性化代理和执行代理,人工评估结果显示在顺序设置中使用这些代理效果最佳,但仅有约 51% 的准确率,误差分析显示 LLMs 在生成的过 - 使用定制化的影响:关于人机协作中信任感知的研究
通过一项针对 17 名参与者的纵向研究,我们调查了信任、人机协作、辅助机器人个性化以及定制化因素之间的关系,我们的研究结果表明,辅助机器人的定制化程度与信任感和舒适度感知之间呈正相关,这对于设计可信赖和定制化机器人的辅助机器人设计过程具有重 - ICCV设备端实时自定义手势识别
该研究论文提出了一个用户友好的框架,使用户能够自定义和部署自己的手势识别流程,包括使用预训练的单手嵌入模型进行微调,提供低代码解决方案用于训练和部署自定义手势识别模型,以及提供无代码的 Web 前端,最终得到的自定义手势识别可以在实时场景中 - 预训练多语言翻译模型中的属性控制器是否具有可迁移性?
以预训练的大规模多语种翻译模型为基础,通过研究训练和推理过程中的控制技术,探索了零 - shot 方向上的属性控制能力,并在低资源语言孟加拉进行了人工评估。
- 大规模自动有声书制作
开发了一个系统,利用神经文本转语音技术从在线电子书中自动生成高质量的有声读物,并允许用户自定义朗读速度、风格、情感语调,并使用少量样本音频匹配所需的声音。
- 模型的生成模型:多样任务和资源限制下的 DNN 快速定制
NN-Factory 是一个一站式框架,通过基于生成模型的方式,能够在不同的边缘场景中快速生成定制的轻量级模型,以满足边缘任务和资源限制的需求。
- 亮度增强和着色:用于定制化低光图像增强的分离网络
提出了一种称为 BCNet 的 “明亮和着色” 网络,通过引入图像着色来解决低光条件下图像增强的问题,并实现基于用户偏好的不同饱和度和颜色风格的定制增强。
- AdjointDPM:扩散概率模型的梯度反向传播的伴随敏感度方法
使用概率扩散模型自适应定制的新方法 AdjointDPM,采用伴随灵敏度方法通过解决带有增广 ODE 的概率流 ODE 来进行梯度反向传播,从而实现对模型参数和生成内容的梯度控制,进而在可视效果转换、特定类型风格化和安全审计等任务上展示了