- 医学对话的实时语音摘要
医患对话总结在识别与医学相关的信息中至关重要,本研究首次提出了用于工业实际应用的实时语音总结系统,并在会话中每 N 个语音表达后生成局部总结和会话结束后生成全局总结。我们的系统可以从商业角度提升用户体验,同时从技术角度降低计算成本。此外,我 - AI 放射科医生:用卷积神经网络和医师友好的图形用户界面革新肝组织分割
AI Radiologist 是一种使用卷积神经网络进行肝脏组织分割和三维插值的图像处理工具,通过现有的体积和预训练模型的选择,为临床医生提供了方便的肝脏组织分割方法。
- 深度 SSM 结构的长度无关泛化界限与稳定性约束
通过提供对稳定状态空间模型块的 PAC 界限,本文论证了稳定状态空间模型块的使用在理论上是合理的,并且该界限随着状态空间模型块的稳定程度的增加而减小。
- 检测学习者参与度的通用模型:实施与评估
考虑到学习者参与可以对学习者和教师带来共同的利益,本文提出了一个通用的轻量级模型,以选择和处理特征来检测学习者的参与度,同时保留随时间变化的顺序时序关系。通过分析公开可用的 DAiSEE 数据集中的视频,该模型能够捕捉学习者参与度的动态本质 - SGHateCheck: 检测新加坡低资源语言中仇恨言论的功能测试
为解决当前对仇恨言论的检测模型的局限性,本文介绍了一种新颖的框架 extsf {SGHateCheck},该框架专为新加坡和东南亚地区的语言和文化背景而设计。它扩展了 HateCheck 和 MHC 的功能测试方法,利用大型语言模型进行翻译 - 常规模型和 Transformer 模型在高光谱图像分类中的不相交采样的重要性
通过不重叠采样来评估最新模型的关键性,本文提出了一种创新的不重叠采样方法,用于超光谱图像分类任务的最新模型训练,通过分离训练、验证和测试数据,消除了数据泄露,提供了可靠的指标来评估模型在超光谱图像分类中的进展和应用。
- SIGIR情感支持对话的动态演示检索与认知理解
通过动态演示检索、认知理解等手段提高情感支持对话系统的质量,该系统在多项指标上取得了显著的改进并提供支持。
- HeMeNet:蛋白多任务学习的异构多通道等变网络
通过输入蛋白质的三维结构,我们提出了一种神经网络模型来同时处理多个任务,该模型名为异质多通道等变网络(HeMeNet),可捕捉不同原子之间的异质关系,并通过任务感知读出机制实现任务特定学习。我们在多任务基准数据集上进行了广泛评估,验证了多任 - 深度学习与最新应用的调查
综述了深度学习在计算机视觉、自然语言处理、时间序列分析和普适计算领域的最新模型以及其在解决各个领域问题中的有效性,并介绍了深度学习的基础知识、各种模型类型以及重要的卷积神经网络架构,并讨论了深度学习研究的挑战和未来方向。
- COLING大型语言模型能否自动评估书面文章的熟练程度?
利用大型语言模型(LLMs)对写作文章进行自动评分的实验表明,虽然适当选择题目对任务和模型性质很重要,但 ChatGPT 相比 Llama 在综合和个体写作特征上的性能稍优。尽管与 SOTA 模型相比预测存在差距,但它们提供了改善文章质量的 - 学术界和工业界在人工智能研究中的互补贡献
人工智能(AI)在工业和学术界取得了巨大的发展。然而,工业界最近取得的令人瞩目的进展震撼了世界,这使得我们对学术研究在这一领域中的作用有了新的认识。我们通过对过去 25 年间工业界和学术界在 AI 领域产生的影响和类型进行了界定,并建立了一 - 身份证和旅行文件的合成数据集
本研究提出了一个新的合成身份证和旅行证件数据集(SIDTD),该数据集旨在帮助培训和评估伪造身份证件检测系统。通过在该数据集上训练先进模型并与较大但私有的数据集进行比较,有助于推动身份证件验证任务在图像分析领域取得进展。
- 大型语言模型是否能编辑?评估其按照编程编辑指令的能力
通过一个仔细设计的代码编辑任务基准以及结合自然语言指令的训练集,我们评估了几个最先进的大型语言模型,并揭示了现有开源和闭源模型之间的显著差距。同时,我们展示了通过精细调优开源代码语言模型可以显著提高其代码编辑能力。
- 计算机视觉中的唇部分割技术探索:一项比较分析
对当前最先进的嘴唇分割模型进行全面评估,比较它们在性能和推理时间上的表现,为未来嘴唇分割的轻量级技术发展和基准建立做出贡献。
- 生成智能的进展:GANs、GPT、自编码器、扩散模型和 Transformer 的综述
ChatGPT 是生成人工智能领域的重要里程碑,引发了新一轮关于先进模型与任务的研究及创新,并带来了无数创新性工具和挑战。
- SIGIR文本 - 视频检索中的单查询后处理的 Sinkhorn 变换
基于 Sinkhorn 变换的新型后处理方法在多模态检索中取得了比双 softmax 损失更好的效果,并提出了一种新的后处理设置,不需要访问多个测试查询,可以显著提高 CLIP4Clip、BLIP、X-CLIP 和 DRL 等先进模型在多个 - 再评估合成路线的算法与 Syntheseus
近年来,如何综合分子的规划,即背向合成,已成为机器学习和化学领域关注的焦点之一。然而,现有技术存在系统性缺陷,由于缺乏完善的基准和一致的比较方法而被掩盖。为解决这个问题,我们提出了一个名为 syntheseus 的基准库,以默认方式促进最佳 - 语言模型在半结构化和非结构化对话数据集中的主题分割
我们综合分析了现有的最先进主题分割模型在非结构化文本上的泛化能力,并发现充分训练目标非结构化领域的相对较小规模数据集可以显著提高分割结果。在对非结构化和半结构化聊天进行分割时,我们的实证评估表明,Focal Loss 函数是交叉熵和加权交叉 - EMNLP网络讨论中的价值观差异对意见不合的影响
在线讨论中存在分歧,个人价值观的差异是在线讨论分歧的指示;我们通过先进的模型估计在线讨论的价值观,并将其聚合成价值观档案,发现价值观档案的差异与特定情况下的分歧相关,并发现将价值信息纳入协议预测可以提高性能。
- 基于激光雷达的全景分割与追踪
本文提出了一个简单而有效的基于检测的网络,用于激光雷达全景分割和追踪任务,通过使用点级别注释训练目标实例检测分支,以及使用轨迹级别监督回归模态中心和物体范围来获取细粒度实例段,该方法在多个 3D/4D LPS 基准测试中表现出色,超过最新的