- 关注差距:预测与决策中的偏见放大的因果视角
通过因果分解从真实世界中存在的偏见与优化过程本身导致的因果差异中解脱出来,研究论文引入了边界互补的概念,并提出了衡量预测分数变化的新方法,以解决自动化系统的公平性和公正性问题。同时,还介绍了部分业务必要性的概念和评估算法,以应对潜在的偏见放 - 增强的 BERT 嵌入用于学术出版物分类
本研究报告介绍了基于预训练语言模型的转移学习方法在学术文献分类中的运用。通过丰富数据集、使用不同的预训练语言模型,并调整超参数,研究发现 fine-tuning 预训练模型可以显著提高分类性能,其中 SPECTER2 模型效果最佳。此外,将 - ACLRAGAR: RAG 增强的政治事实检验的虚假识别雷达,基于多模态大语言模型的推理
通过将大型语言模型(LLMs)与基于检索增强生成(RAG)的先进推理技术相结合,本研究提出了两种创新方法(CoRAG 和 ToRAG),以增强多模态事实检验的可靠性和效率。通过分析文本和图像的多模态 LLMs,该研究推动了自动化系统在辨别和 - 自动机构:权力与人工智能
人工智能、自动化系统、大型语言模型、权力关系和哲学素材是本篇论文的关键词,并通过探讨权力概念、AI 对权力的影响以及解决权力问题的方法,强调了权力正当性和程序合法性的重要性。
- 自动诊断筛查总结的大规模语言模型微调
改进发展中国家中的心理健康支持是迫切的需求,其中一个潜在解决方案是开发可扩展的自动化系统进行诊断筛查,可以帮助减轻心理健康专业人员的负担。本研究评估了几种最先进的大型语言模型(LLMs),在我们的定制数据集上进行了简明摘要生成的评估。我们使 - 通过 Few-shot 学习和 SBERT Fine-tuning 进行牙齿严重程度评估
在这项研究中,使用 13 种不同的机器学习、深度学习和大型语言模型来基于放射科医生的报告确定口腔健康问题的严重程度。结果显示,Few-shot 学习与 SBERT 和多层感知器模型在各种实验中都表现优于其他模型,取得了 94.1%的最佳准确 - LLM 在谈判对话中的多维能力的系统评估
通过分析 LLMs 在各种对话场景中的多面能力,该研究旨在了解 LLMs 如何推进不同方面的谈判研究,包括设计对话系统、提供教学反馈和扩大数据收集实践。结果表明,虽然 GPT-4 在各种任务上表现出优越性,但在主观评估谈判对话和生成上下文恰 - MedLM:探索面向医学问答系统的语言模型
本研究通过比较一般性和专用于医学问答的精简语言模型的性能,旨在填补这方面的空白,并评估不同语言模型家族的性能,以探讨这些模型在医学问答领域的可靠性、比较性能和有效性,从而为不同语言模型在医学领域的特定应用提供有价值的见解。
- MultiFusionNet:多层次多模态深度神经网络的胸部 X 光图像分类
通过利用卷积神经网络,提出了一种基于多层多模态融合模型的新型深度学习疾病检测模型,能够从不同层次提取特征并融合它们,在胸部 X 射线图像的疾病分类中取得了高达 97.21% 和 99.60% 的显著准确率,具有准确的疾病分类潜力,并可推广至 - CattleEyeView: 一种用于智能精准畜牧农业的多任务自上而下视角的牛数据集
介绍了 CattleEyeView 数据集,这是第一个自顶向下视角的多任务牛视频数据集,可用于牛的计数、检测、姿势估计、跟踪和实例分割,以评估模型在每个任务上的性能。
- 跨多元社群中有毒评论识别的主观建模(通过模仿标注者注释)
在线毒性讨论的普及和影响使内容管理至关重要。自动化系统在识别有毒评论和减少对人工管理的依赖方面起着至关重要的作用。然而,识别多样化社区的有毒评论仍然存在挑战,本研究对此进行了探讨。
- 植物叶片病害的深度学习检测综述
该研究论文通过深度学习模型系统综述了叶病害诊断领域的多种叶病害基于叶片的模型,包括 Vision Transformer (ViT)、Deep convolutional neural network (DCNN)、Convolutiona - MM潜变量能量模型介绍:通向自主机器智能之路
现有自动化系统存在重要限制需解决,Yann LeCun 提出未来自主智能系统的架构,结合基于能量的和潜变量模型的优势,形成分层联合嵌入预测架构(H-JEPA),以实现自动驾驶汽车、家庭机器人等复杂任务的全面解决方案。
- 使用语言处理技术增强普什图语文本分类的单标签和多标签分析
本研究的目标是建立碧斯图文自动分类系统,研究者通过使用 DistilBERT、MLP、SVM、KNN、随机森林等各种机器学习模型和文本特征提取方法对 Pashto 文本进行分类,研究表明在单标签多分类中,使用 MLP 和 TFIDF 特征提 - 检测新闻文章中的有害议程
本研究提出新的任务,释放了新闻文章数据集 NewsAgendas,用于检测有害议程;为了有效,这些有害议程检测器必须是可解释的,并且可解释模型的表现可以与黑盒模型相媲美。
- COLINGImageArg:用于图像说服挖掘的多模态推特数据集
本研究的重点在于将具有说服力的图像转换为多模式数据,开发用于自动化系统的多模式数据集,然后使用这个数据集对图像说服力任务进行基准测试和实验,通过开发一种说服分类方法来划分图像的说服功能和说服方式,为这一高级领域提供有用的资源。
- CoQAR: CoQA 上的问题重写
提出使用问句重写作为预处理步骤来弥补人类在对话中提出的带上下文依赖但自动化系统无法理解的问题,使用人工标注的 CoQAR 语料库进行了实验,证明了该方法对于提高对话问答模型性能的有效性。
- ACLHLDC: 印地語法律文件語料庫
本文介绍了一个 Hindi Legal Documents Corpus (HLDC) 的语料库,它包含了超过 900K 的清理和结构化的印地语法律文件。通过使用该语料库,我们引入了保释预测的任务,并使用了多任务学习(MTL)模型作为主要任 - CVPR现实临床环境下鲁棒的新生儿面部检测
本文通过使用专有数据集对 You-Only-Look-Once(YOLO)算法进行训练,实现了对新生儿面部特征的快速准确检测,进而为自动化系统(例如疼痛识别和监控)提供帮助。
- SemEval-2021 任务 11:NLPContributionGraph—— 为研究知识图谱构建学术 NLP 贡献分类结构
该论文介绍了 SemEval-2021 的任务,主要是在英文文献 NLP 领域中,开发自动化系统进行结构化内容解析,构建知识图谱,最终 7 个团队中的 27 位参与者共同完成了该任务。