BriefGPT.xyz
Ask
alpha
关键词
vision system
搜索结果 - 5
ICML
Libra: 基于大型语言模型构建解耦视觉系统
这项研究介绍了 Libra,这是一个拥有解耦视觉系统的大型语言模型原型。Libra 通过离散的自回归建模,训练视觉和语言输入数据,实现跨模态交互。实验证明,Libra 的专门设计在图像到文本场景中提供了一个强大的 MLLM 基准,仅使用 5
→
PDF
2 months ago
噪声环境中机械臂动作识别机器学习模型的鲁棒性评估
在嘈杂的环境中,通过使用机器学习技术和视觉系统来识别机器人手臂的动作是一个重要挑战。本文通过比较分析机器学习方法,研究了机器人手臂在嘈杂环境中的动作识别,并评估了该模型在噪声环境中的有效性和鲁棒性。通过在一个 3x3 网格环境中进行的井字棋
→
PDF
6 months ago
一个用于在杂乱环境中抓取收获的番茄藤的视觉引导机器人系统
对于已经收获的番茄藤条的自动称重和包装存在困难,本文提出了一种方法,通过深度学习视觉系统首先识别存储和运输中以杂乱方式堆放的木箱中的番茄藤条,然后确定适合的抓取位置,并采用在线学习能力的抓取姿势排序算法选择最有前景的抓取姿势,从而实现无需触
→
PDF
9 months ago
提高自主手机相机模块测试可靠性的取放式机器人视觉系统研发
利用基于摄像头和树莓派的硬件以及直方图信息的简化图像处理算法,提出了一种能够增强取放式机器人自主测试摄像头模块记忆体的可靠性的视觉系统,能够在摄像头模块进料托盘中确认其存在并确定在测试插座中的放置准确性。实验结果表明,该系统的准确度超过了
→
PDF
a year ago
通过潜在转换实现循环一致反事实推论
本研究提出一种新颖的方法 C3LT,它能够自动生成高质量的 CF 图像并且不需要优化时间。该方法采用生成模型的潜在空间中的循环一致性来实现,在 ImageNet 数据集上进行了充分的实验验证。
PDF
2 years ago
Prev
Next