- 通过分子构建语义通信系统:一种端到端训练方法
提出一种语义分子通信系统,通过减少传输的信息来增强分子通信系统的效率,并展示其在分类任务中相较于传统方法的卓越性能。
- FAQ-Gen: 自动生成特定领域的常见问题解答以帮助理解内容
通过开发一种利用文本到文本转换模型的端到端系统,本文研究了常见问题解答(FAQ)的生成作为一项明确定义的自然语言处理(NLP)任务,并且通过对传统问答系统的文献综述提出了我们的系统,能够根据特定领域的文本内容构建相关的 FAQ,提高准确性和 - 走向一种全端到端人工智能驱动的全球天气预报系统
全球天气预报系统中关键的数据同化模型 Adas 与 AI 天气预报模型 FengWu 的组合系统 FengWu-Adas 表现出高水平的预报技能,在七天的天气预报中超过了集成预报系统 (IFS)。
- VR-NeRF:高保真虚拟行走空间
我们提出了一个端到端系统,用于在虚拟现实中高保真地捕捉、重建模型并进行实时渲染可行走空间,使用神经辐射场。
- 优化库存路线:基于决策导向学习的神经网络方法
我们提出了一种面向决策的基于学习的方法来解决实际的库存路径规划问题,该方法直接整合了库存预测和路径优化于一个端到端的系统中,可能确保一个稳健的供应链策略。
- 终端到终端音频识别的声学模型融合
最近在深度学习和自动语音识别(ASR)方面的进展使得端到端(E2E)ASR 系统成为可能,并且将准确性提升到一个新的水平。我们提出将外部的 AM 整合到 E2E 系统中,以更好地解决领域不匹配问题,并取得了显著的词错误率降低,尤其在增强命名 - 人机交互中自然语言量词的形式化
介绍了一种形式化自然语言中量词的方法,运用于人机交互的背景下,该方法基于带有变量基数表示能力的一阶逻辑,类似于广义量词的操作;通过设计了一个端到端系统,能够接收自然语言输入,将其转换为形式逻辑表示,进行评估,并返回结果或向模拟机器人发送命令 - 决策导向学习:基础、现状、基准和未来机遇
决策导向学习是机器学习中的新兴范式,通过训练模型来优化决策,在一个端到端的系统中集成预测和优化。本研究论文全面回顾了决策导向学习领域,深入分析了整合机器学习和优化模型的各种技术,引入了决策导向学习方法的分类体系,还对这些方法进行了广泛的实证 - 基于深度学习模型的驾驶策略预测
本项目实现了一个端到端系统,该系统接收来自普通摄像头的视频帧的综合视觉特征和来自点云扫描仪的深度信息,并预测驾驶策略(车辆速度和转向角度)。通过与真实世界经验丰富的驾驶员的标准行为进行比较,我们验证了我们系统的安全性。我们的测试结果表明,在 - ICLR众包标签深度学习:交叉熵最小化、可识别性和正则化
本文提出了一种基于深度学习的端到端系统,利用嘈杂的众包标签,通过多个注释器特定的 label confusion 层和参数耦合的方式,与神经分类器同时学习标签纠正机制,并提出了 CCEM 的正则化变种,以增强目标模型参数的可识别性。
- 使用 Transformer 全流程生成从科学摘要中获取幽默的标题
研究了基于 Transformer 的 7 种模型在 NLP 和机器学习场景下的抽象到标题生成问题,并扩展到更难的生成幽默科学论文标题的问题。使用人类和自动度量衡方法评估了所有模型,发现最好的端到端系统与人类作者表现相似,而 ChatGPT - 开放领域问答中领域自适应挑战与干预:调整或注释?
研究开放领域问答(ODQA)中,当应用于广泛不同的领域时,此类模型的稳健性和应用性能。该研究提出了一个更现实和具有挑战性的领域转移评估环境,并研究了端到端的模型性能。他们发现,不仅模型在推广方面表现出失败,且高检索分数通常也不能提供准确的答 - EMNLP通过学习从其他修订任务中编辑的位置来改进迭代文本修订
本论文旨在构建一个端到端的文本修订系统,该系统可以通过显式检测可编辑范围及其对应的编辑意图并指导修订模型来迭代生成有用的编辑,从而更准确地模拟迭代文本修订的过程,并在我们的文本修订任务和其他标准文本修订任务上显著优于以前的基线,包括语法错误 - EMNLP面向统计法律分析的数据高效端到端信息提取
该研究介绍了一种用于法律文件信息抽取的端到端系统,实验结果表明,该系统可以在少于 50 个训练样本的情况下比基于规则的基线方法得到更好的结果,并且使用 200 个样本可以得到更高的得分,并且使用这个系统从醉酒驾驶和欺诈两个案例类别的 3.5 - 无文本直接语音翻译与离散语音表示
本文提出了一种基于 Translatotron 2 的 Textless Translatotron 模型,使用预处理的无监督语音数据的语音编码器进行训练,针对缺乏书面形式的语言进行端到端的直接语音翻译,效果优于之前的最佳无文本模型,且在多 - EMNLP基于新闻文章的开放性问题生成的一致性
本研究提出了一种名为 CONSISTENT 的端到端系统,用于生成可以回答输入文本并忠实于其的开放式问题,并证明了该模型相对于其他基线模型在自动和人类评估方面的优势,并且讨论了该技术在新闻媒体组织和其他领域的潜在应用。
- 利用古箏演奏中的音符觸發信息進行演奏技巧檢測
本文提出了一个利用全卷积神经网络的端到端古筝演奏技巧检测系统,通过训练独立的起始检测器和帧级演奏技巧检测器以实现对可变长度音频的检测,这可以应用于各种音乐厂牌。同时,作者还从多个音乐厂牌和实际演出中创建了一个新的数据集 GZ_IsoTech - COLING面向任务的端到端对话的自回归实体生成
本文提出了一种基于语义实体自回归的端到端任务导向对话系统,通过逐步生成语义实体并结合当前对话上下文,生成更高质量、一致性更强的对话回复。
- 面向生物医学和 COVID-19 复杂问答的查询焦点抽取式摘要
本文介绍了麦考瑞大学参加 BioASQ Synergy Tasks 和 BioASQ10b Task B 的情况,其中采用了查询导向的摘要技术,并使用了 DistilBERT/ALBERT 分类器、文档检索和片段检索的方式,sBERT 向量 - 导航的视觉预训练:从噪声中我们能学到什么?
本文提出了一种基于自监督的方法,通过预测目标视图对于当前视图的裁剪位置和大小,学习得到足够的表示以训练一个有效的导航策略。该方法得到的模型具有较高的迁移性和数据效率。