- 为多民族社区在灾难准备交流中定制生成式 AI 聊天机器人:拓展 CASA 模型
通过与 441 名佛罗里达州的黑人、西班牙裔和高加索居民进行一项实验,研究以 CASA 为范例和关于灾害脆弱性和文化调适的文献所驱动的不同原型的 GPT 4 生成 AI 聊天机器人如何向各种不同居民传递飓风防灾信息,计算分析聊天记录(N = - 评估 LLM 申请的挑战:自动、人工和基于 LLM 的方法分析
聊天机器人的评估是一个重要问题,本研究介绍了一种综合评估机制,该机制结合了人类评估和基于 LLM 的评估,并通过实验证明基于因子的评估在 LLM 应用中提供更好的洞察力,进一步加强了在主要功能不是直接检索的关键空间中使用人类评估的论点。
- 克服 LLM 聊天机器人中误校准的对话先验
通过对聊天记录分析,发现查询的不明确性是常见的,据此,借助控制信息重校准预训练大型语言模型聊天机器人的回应策略,以改进其在推荐任务中的表现。
- 使用真实世界的医生与患者互动评估大型语言模型的共情能力
大型语言模型(LLMs)在医疗领域的整合潜在地可以通过开发具有共情能力,面向患者的聊天机器人,显著增强患者护理和支持。本研究调查了一个有趣的问题:相较于通常由医生提供的,ChatGPT 能否提供更高程度的共情回应?为了回答这个问题,我们从梅 - 辅助指导:基于 LLM 技术的聊天机器人与人类教练结合的混合形式,有效支持领导力成长的自我反思
探索使用近期大型语言模型(LLM)与专业教练合作的聊天机器人在高管教练领域潜力的论文,发现了聊天机器人的普适性和推理能力的好处,同时明确了其局限性和与人类教练有效合作所需的设计要求,为使用对话代理增强自我反思过程的人机合作奠定了基础。
- Sunnie: 一个基于人形化 LLM 的谈话代理人用于心理健康活动推荐
通过研究聊天机器人的人格设计和对话体验设计,本文探讨了人形化设计是否能增强用户对系统的感知和接受心理健康活动建议的意愿。研究结果显示,人形化特征显著提升了用户对系统和整体可用性的感知,然而,用户接受活动建议的意愿并未显著改变。
- 将实时互动会话建模为定时记录的转录
使用预训练的纯文本语言模型,通过建模定时记录的转录文本并使用因果拒绝采样进行解码,我们提出了一种简单但通用的方法来模拟实时互动对话。我们通过两个案例研究(即即时通讯对话和口语交流)展示了该方法的潜力,这些案例研究需要分别以约 30 tok/ - AI 聊天机器人从患者的病情投诉中进行疾病预测的可靠性
人工智能聊天机器人在预测疾病方面的可靠性进行了研究,结果表明虽然聊天机器人的准确性有所差异,但它们都无法足够可靠地进行重要的医疗决策,强调了对严格的验证和人类监督的必要性。
- ICLRWildChat:百万条 ChatGPT 野外互动日志
ChatGPT 发布了 WildChat 数据集,包含 100 万个用户与 ChatGPT 之间的对话,记录了最多样的用户提示,最多语言和最丰富多样的潜在有毒使用案例;同时,还基于地理区域和时间维度丰富了用户行为的详细分析,证明了数据集在指 - 英语是新的编程语言吗?伪代码工程呢?
人工智能、聊天机器人、自然语言处理、输入形式和伪代码工程。通过分析 ChatGPT 的回应来探究不同输入形式对 ChatGPT 在理解和执行复杂多意图任务方面的表现。
- 朝着可靠和富有同理心的抑郁症诊断导向聊天
Chatbots can help diagnose depression by combining task-oriented conversations with empathy-related chit-chat, as demons - 避談:使語言模型在對話中保持主題一致
使用 CantTalkAboutThis 数据集对语言模型进行 fine-tuning,可以在任务导向的交互中帮助模型保持主题相关性,提高其维持话题连贯性的能力,并加强对精细化指令的追踪任务的表现。
- ChatGPT 在生物信息学和生物医学信息学中的应用:第一年回顾
2023 年,将大型语言模型(LLM)聊天机器人 ChatGPT 应用于各个领域迎来了显著增长;我们调查了 ChatGPT 在生物信息学和生物医学信息学领域的各个部门中的应用情况,涵盖了组学、遗传学、生物医学文本挖掘、药物发现、生物医学图像 - Tur [k] ingBench: 网页代理挑战基准
通过实验模拟了多模式预训练对网络页面的理解能力,在基准测试中发现了现有模型的优势和不足,并希望该基准测试能促进网络代理的评估和发展。
- 火灾工程中的大型语言模型:领域知识对技术问题的考察
比较 OpenAI 的 ChatGPT 和 Google 的 Bard 两个聊天机器人在消防工程领域的表现,结果显示 ChatGPT 表现较为优秀,该技术有望在消防工程实践和教育中起到重要作用。
- 认知即所需 - 大型语言模型之上的人工智能下一层
近期关于应用于复杂实际知识工作的对话人工智能工具(如由大型语言模型驱动的聊天机器人)的研究表明,这些工具在推理和多步问题解决方面存在限制,且现有聊天机器人模拟浅层推理和理解,在问题复杂度增加时容易出错。本文介绍了认知人工智能(Cogniti - SyllabusQA:课程逻辑问答数据集
自动教学助理和聊天机器人在减轻人工教师负担方面具有重要潜力,特别是对于物流相关问题的回答,这对学生而言非常重要但对教师而言却是重复的。然而,由于隐私问题,缺乏公开可用的数据集。我们介绍了 SyllabusQA,一个开源数据集,其中包含 63 - 教师设计 LLM 聊天机器人辅助青少年网络欺凌教育的研究
网络欺凌危害青少年的心理健康,教授他们正确的干预行为至关重要。我们设计了一种针对 K-12 教师的无代码聊天机器人设计工具,通过使用大型语言模型和提示链技术,该工具允许教师设计个性化的对话流程和聊天机器人表达。研究结果显示,教师们热情地接受 - SPML:一种用于抵御提示攻击的语言模型领域特定语言
该论文介绍了系统提示元语言(SPML),用于改进和监控基于大型语言模型的聊天机器人的输入,以防止恶意执行,优化成本,并展示了具有 1.8k 系统提示和 20k 用户输入的开创性基准,从而超越了 GPT-4,GPT-3.5 和 LLAMA 等 - 将互动科学展览延伸至课堂:运用拟人化的聊天机器人与布鲁姆分类法
该研究探索了使用生成性人工智能聊天机器人将公共科学展览转化为虚拟体验,以延伸展览的参与至教室,旨在增加科学展览的可访问性,特别是针对因多种因素包括文化障碍而在 STEM 中处于边缘化的人群。研究主要探讨是否可以利用生成性人工智能(例如 GP