- 推进耳部生物特征识别:通过深度学习提高准确性和鲁棒性
本研究关注耳部生物特征识别,通过利用其独特特征来提高准确性、可靠性和实用性,并证明了耳部生物特征识别在克服面部表情和光照条件变化等局限性方面的有效性。通过数据预处理和增强等技术,我们的模型在 AMI 数据集上实现了 99.35% 的测试准确 - 快速 PGM:快速概率图模型学习与推理
Fast-PGM 是一个高效且开源的库,支持概率图模型的学习和推理任务,提供计算和内存优化以及并行化技术,同时为开发者提供灵活的构建模块、详细的文档,并向非专业用户提供用户友好的界面,提高了概率图模型在不同专业水平用户之间的可用性。
- 使用 AI 工具预测移动应用的可用性:大型用户界面模型的崛起、机遇与挑战
在移动应用程序的背景下,本文提出了所谓的大型用户界面模型(LUIMs),以通过人工智能生成用户界面并预测可用性。
- SARD: 人工智能与人类协作的故事生成
我们提出了一个名为 SARD 的可视化工具,用于利用大型语言模型生成多章节故事,通过对其可用性和创意支持的评估,我们发现节点可视化可能有助于作者建立心理模型,但在故事更加复杂时会导致不必要的认知负荷和注意力分散,还发现无论故事复杂与否,AI - 使用生成式人工智能实时增强编程错误消息
应用生成式人工智能技术改善编程问题、错误信息及自动化评估工具的可用性。
- 多行 AI 辅助代码撰写
CodeCompose 是一款由大型语言模型(LLM)驱动的人工智能辅助代码撰写工具,可以为数以万计的开发人员提供行内建议。本文介绍了我们如何将该产品从显示单行建议扩展到多行建议,并克服了提高开发者使用这些建议的可用性所面临的几个独特挑战。
- 基础模型向导:通过知识和推理指引基础模型
基于对代理与基础模型互动模式的分类和对该模式的扩展架构提出的综述性论文,为实现基础模型在实际人工智能系统中的潜力提供了指导。
- SoK: 从高层自然语言需求生成访问控制策略
通过对 49 篇文献的系统文献综述分析,我们找到了那些工具、框架及其限制,以提高其可用性和可靠性,从而开发有效的访问控制策略生成解决方案,避免访问控制失效。
- 通过交互生成数字模式和视觉表示进行神经网络的主动学习
为了改善用户对神经网络的学习和理解,本文设计了一个交互式学习系统,用于实时创建并识别数字模式,并通过可视化技术在二维空间中呈现数字模式的视觉差异和神经网络结果,通过多个数据集的评估和夏季研讨会的非正式用户测试,验证了系统的可用性。
- 移动终端中口语化人形对话机器人的可用性评估
本研究通过实证调查,评估讲述人机器体验交谈代理(HECAs)在移动游戏应用程序的可用性方面的影响。研究目的是评估多个代理和人性幻觉对交互质量的影响。实验调查了两种代理展示方式:高人类相似性(HECA)代理和低人类相似性(文本)代理,旨在评估 - Data-Juicer:大型语言模型的一站式数据处理系统
我们提出了一种强大而灵活、易于使用的数据处理系统 Data-Juicer,它提供了 50 多种内置的多功能操作符和可插拔工具,通过可视化和自动化评估能力,加快数据处理并获得数据洞察力,提供用户友好的界面并发布多种数据配方,同时实现高效和可扩 - 比较在线聊天机器人与传统面对面采访方式在收集家庭史信息方面的有效性
我们的研究展示了首个用于收集家族史的基于聊天机器人的方法,通过比较其表现和可用性与其他替代方案的差异,我们发现虽然使用聊天机器人进行访谈的时间可能比使用 ancestry.com 或面对面访谈时间更长,但是错误数量和用户对界面和流程的困惑程 - 地理位置数据对增强现实可用性的影响:一项比较用户测试
通过比较用户测试,评估地理定位数据对位置增强现实接口的可用性、探索性和注意力的影响。研究发现,地理定位数据的不准确性对接口的可用性有负面预测作用,但对于用户的探索行为和注意力没有明显影响。
- 谁回答得更好?ChatGPT 和 Stack Overflow 回答软件工程问题的深度分析
通过对 517 个 Stack Overflow 问题的 ChatGPT 答案的细致分析,以及大规模的语言学分析和用户研究,我们发现 ChatGPT 答案中 52% 的答案是错误的,77% 的答案冗长。尽管如此,由于其全面性和清晰的语言风格 - 机器遗忘:综述
通过分类和总结现有的机器遗忘技术的特点,本文综述了机器遗忘技术的关键理念,并讨论了其面临的挑战和未来的研究机会。
- 文本到 SQL 语义解析的错误检测
本文提出了一种基于预训练代码语言模型和图神经网络结构特征学习的独立于解析器的文本到 SQL 语义解析错误检测模型,实验表明此方法超越了解析器依赖的不确定性度量方法,能够有效提高文本到 SQL 语义解析器的性能和可用性。
- 了解 AI 编程助手的可用性
通过对 410 名开发者进行调查,本研究深入剖析了开发者使用 AI 编程助手的动机、显著的使用场景以及面临的主要可用性挑战,并提出了设计与使用此类工具的建议。
- 语义解析中的置信度权衡
本文研究定制模型如何通过使用置信度得分,在任务导向的解析中权衡成本与标注者的负担,压缩不正确的低置信程序的执行数量,以优化可用性与安全性之间的权衡,并提出了 DidYouMean 系统来更好地平衡可用性与安全性。
- 可编程逻辑控制器安全特性可用性研究:“它确实具有 Windows 98 的感觉
通过一个基于任务的研究和随后的半结构化访谈 (N=19),探究了 PLC 连接配置和两个关键安全机制 (即访问级别和用户管理) 的可用性,结果发现不熟悉的标签使用、布局和误导性术语的使用加剧了配置安全机制的复杂性。我们提供设计建议,使得工业 - 基于情境的副驾驶:程序员如何与代码生成模型交互
通过观察 20 名参与者与 Copilot 互动解决不同编程任务的方式,通过首次建立的理论分析表明,编程助手的交互为双峰分布:在加速模式下,程序员知道下一步该做什么并使用 Copilot 完成;而在探索模式下,程序员不确定如何进行并使用 C