- 基于客户模拟的面向客户的 LLM 治疗师评估
采用 LLM 来模拟患者并提出了以客户为中心的 ClientCAST 方法,通过模拟客户与 LLM 治疗师互动完成问卷调查,从会话结果、治疗联盟和自我报告感受三个客户中心的方面评估 LLM 治疗师。进行了实验证明 ClientCAST 的可 - 书写运动和书写障碍评分量表(GHDRS):走向复杂和客观评估
引入 GHDRS 图动观 - 书写障碍评估量表,实现客观复杂的计算机辅助 GD 和 HD 的诊断和评估。
- LOVA3:学习视觉问答、提问和评估
通过引入名为 LOVA3 的创新框架,我们的研究旨在扩展 Multimodal Large Language Models(MLLMs)的能力,包括回答、提问和评估问题,在提高多模态理解能力和性能方面取得了一致的改进。
- 学生软件项目评估的模糊智能系统
开发软件项目允许学生将知识付诸实践并培养团队合作能力。本研究介绍了一个模糊智能系统,以面向对象编程和设计课程的学术软件项目作为例子,用于评估学生项目表现。该系统通过制定评估标准,将关键参数和可适用范围识别为模糊变量,并与专家合作定义一组模糊 - CVPR探索 AIGC 视频质量:以视觉和谐、视频文本一致性和领域分布差异为重点
这项研究基于 Text-to-Video 人工智能生成内容 (AIGC) 的最新进展,针对 AIGC 视频的质量评估遇到的挑战进行了分类,并提出了特定模块来综合评估 AIGC 视频的视觉和内容一致性,在不同的生成模型中发现了重要的视觉质量、 - 生成式人工智能工具时代的高等教育评估实践
本研究通过对生成人工智能工具对评估和教学实践的综合评估,探讨了其潜在影响。结果表明,生成人工智能工具在主题知识、问题解决、分析、批判性思维和演示技能方面具有限制学习的潜力。同时,对某些学科评估工具的设计揭示了生成人工智能工具的局限性。基于研 - 大型语言模型在心理健康领域的机遇和风险
全球心理健康问题的比例正在上升,现有的心理卫生模型已无法满足需求;大型语言模型 (LLMs) 的出现给人们带来了巨大的希望,有望创造新颖的、大规模的解决方案来支持心理健康。在这篇综述中,我们总结了现有文献关于使用 LLMs 提供心理健康教育 - 通过视觉语言模型中的知识增强,提升神经退行性疾病步态视频分析
通过基于大规模预训练的视觉语言模型(VLM)的知识增强策略,我们的模型学习并改进了患者步态视频的视觉、文本和数值表示,通过跨三个不同模态的集体学习:步态视频、特定类别的描述以及数值步态参数。实验结果表明,我们的模型不仅在基于视频的分类任务中 - 预期进球模型中的偏见影响进攻能力
该研究旨在解决使用 xG 统计评估足球射门能力时的局限性和细微差别问题。研究发现,持续高精准度的累计 xG 需要大量射门和出色的射门技巧,包括所有射门类型会模糊优秀前锋的射门能力,而实际与预期进球之间存在持续偏差,使得出色射手的进球数与预期 - 异常评分:基于复杂性和脆弱性评估生成模型和个别生成图像
基于生成模型的评估,该文研究了生成图像的表示空间与输入空间之间的关系,并提出了一种新的评估方法 —— 异常分数(AS)和个体图像的异常分数(AS-i),实验结果证明了该方法的有效性。
- 基于视频的手术技能评估:树型高斯过程分类器
使用视频数据进行评估,展示了所提出方法在评估外科医生熟练程度、针对性培训干预和外科部门质量保证方面的有效性,该流水线结合了表示流卷积神经网络和一种新颖的基于树的高斯过程分类器,它具有抗噪性和计算效率。此外,引入了新的核来提高准确性,该流水线 - 使用 BERT 进行团队合作维度分类
通过自然语言处理和 BERT 模型的深层迁移学习方法,开发了一种自动化评估学生团队合作能力的方法,该方法能够更全面地理解文本的语境以及在不同团队聊天背景和团队成员群体中使用语言的潜力,从而为团队合作评估和反馈提供了改进的学习分析工具。
- 学生能力还是 AI 欺骗?分析 ChatGPT 的评估能力并评估检测策略
通过评估 ChatGPT 在三门课程(CS1、CS2、数据库)上的性能,研究了生成式人工智能对学习和评估的破坏性影响,其几乎完美地完成了所有初级考核,现有的检测方法对识别人工智能解决方案的成功率有所不同,教师和助教使用启发式方法区分学生代码 - 知识追踪挑战:学生优化活动顺序
知识追踪是一种在教育领域中用于评估和追踪个体学习者知识获取的方法,本文通过实施两种知识追踪算法并使用新发布的数据集,展示了解决知识追踪问题的结果,以推动计算机辅助教育应用(如智能辅导系统、课程学习和学习材料推荐)的发展。
- 聊天机器人支持下的论文写作:一份自传式报告
ChatGPT 在学习和评估的功能上对各种学习和评估格式产生了显著影响,但在生发参考文献等方面存在限制,因此需要对生成的结果进行持续验证,写作学生论文仍然需要学习者的有意义参与。
- 采用高斯过程回归进行主动学习的视觉空间忽略评估和治疗
提出了一种基于人工智能的方法来准确评估患者的视空间忽略症,为个性化的康复和医疗护理提供了有前景的途径并通过与常规测试的比较来验证了其准确性和可靠性。
- 使用语言模型隐性自动评估数学简答题
我们提出了一种新的方法来评估数学题的一些简短构建性回答。我们的方法使用一个流程来识别学生回答中指定的关键值,从而确定回答的正确性并发现任何误解。这些关键值的信息可以用于为教师和学生提供反馈,以提供更准确和有用的评估方法,有效改善学生对数学的 - 自我监督语音表示下的非侵入式听障人士智能可懂度预测
将自我监督语音表示应用于对听力受损用户的清晰度预测中,研究发现自我监督表示作为非侵入性预测模型的输入特征具有竞争力的性能,能够在复杂系统上预测清晰度评估
- 痴呆症的人工智能和非人工智能评估
本文回顾了关于人工智能和非人工智能评估痴呆的论文,旨在为医疗社区和人工智能工程师提供有关痴呆症评估的各种方法和数据集的有价值信息,并强调现有解决方案的研究方向和成熟度
- 通过短的生成诗歌片段让熟练读者辨识风格
本研究基于三种基于字符的 LSTM 模型,针对俄罗斯著名诗人的诗歌文本进行了风格复制任务的评估,结果表明,无论如何,专业的评估者比普通读者更能够准确地评估风格,虽然 LSTM 模型在有限的训练语料库上可以很好地复制俄罗斯诗人的风格。