autoregressive model | BriefGPT

关键词autoregressive model

搜索结果 - 48

CVPRDocSynthv2：面向文档生成的实用自回归建模
通过开发一种简单且有效的自回归结构模型，本文在探索综合文档生成，即包括布局和内容的文档生成的更复杂挑战方面提出了名为 DocSynthv2 的新方法，通过关注文档内结构元素与文本内容之间的关系，我们旨在生成连贯且与上下文相关的文档，不依赖于
PDF22 days ago
ContextGS: 带有锚定层上下文模型的紧凑三维高斯分层处理
通过引入上下文模型在锚点级别进行 3D 高斯点片重建表示，相比于标准 3D 高斯点片重建和最新的最先进的 Scaffold-GS 方法，我们的工作实现了超过 100 倍的尺寸减小，并达到可比甚至更高的渲染质量。
PDFa month ago
基于自回归生成的后验采样
使用历史数据进行预训练的自回归模型，在新闻推荐任务中通过端到端微调预训练语言模型来处理新闻文章标题文本以提高性能，并在在线决策中展示了能够理解不确定性和主动收集信息以解决环境变化的新的学习算法框架。
PDFa month ago
PT43D：基于单一高度模糊 RGB 图像生成三维形状的概率变换器
提出了一种基于 Transformer 的自回归模型，根据可能以高度模糊的观测图像为基础的 RGB 图像，生成 3D 形状的概率分布，该模型采用交叉注意力机制，有效地识别形状生成的最相关兴趣区域，并在合成数据和真实数据上得到优于现有方法的结
PDFa month ago
文本生成可解释性中的挑战与机遇
解释性在自然语言处理中的必要性随着大型语言模型的突出地位的不断提升而增加。该论文概述了在属性解释性方法的开发和评估过程中出现的 17 个挑战，包括词条化、定义解释相似性、确定词条重要性和预测变化度量、人类干预的水平以及适合的测试数据集的创建
PDF2 months ago
多尺度膨胀卷积网络用于长期时间序列预测
通过使用浅层扩张卷积架构以捕捉长时间序列的周期性和趋势特征，我们提出了多尺度扩张卷积网络 (MSDCN) 的方法，并设计了具有指数增长扩张和不同卷积核大小的不同卷积块来在不同尺度上采样时间序列数据。此外，我们利用传统的自回归模型来捕捉数据内
PDF2 months ago
StockGPT：用于股票预测和交易的 GenAI 模型
本文介绍了 StockGPT，一种在美国股票每日收益历史数据上直接预训练的自回归 ' 数值 ' 模型。通过将每个收益系列视为标记序列，该模型在理解和预测高度复杂的股票收益动态方面表现出色。利用注意机制，StockGPT 自动学习预测未来收益
PDF3 months ago
深度自回归密度网络与神经集成在基于模型的离线强化学习中的比较
离线强化学习中，通过提供的系统转换数据进行策略优化；研究了基于模型的强化学习算法，并挖掘了模型学习的静态度量方法，以及模型错误对代理的最终性能的影响。
PDF5 months ago
UniTSyn：一个可增强大型语言模型在程序测试中能力的大规模数据集
利用大型语言模型（LLMs）生成高质量代码的能力引起了软件测试界的广泛关注。本文介绍了一个大规模数据集 UniTSyn，用于提升 LLMs 在单元测试合成方面的能力。通过与被测试函数相关联的测试，UniTSyn 使 LLMs 能够推断预期行
PDF5 months ago
规模化生成预训练：基于 Transformer 的交易行为编码用于欺诈检测
介绍了一种创新的自回归模型，利用了 Generative Pretrained Transformer (GPT) 架构，专为支付系统中的欺诈检测而设计。我们的方法创新性地解决了令牌爆炸问题，并通过时间和上下文分析重构行为序列，提供了对交易
PDF6 months ago
利用多输入自回归模型进行轴承剩余使用寿命预测
利用多输入自回归模型将振动信号与先前预测的健康指标值相结合，通过特征融合输出当前窗口的健康指标值，从而解决滚动轴承寿命预测中通用性有限的问题。通过自回归迭代，该模型具有全局感受野，有效克服通用化的限制。在 PMH2012 数据集上的实证评估
PDF7 months ago
UT5：使用展开去噪预训练非自回归性 T5 模型
通过展开去噪并展示其在下游生成任务中的最先进结果，我们研究了 T5 模型的非自回归无监督预训练。
PDF8 months ago
自回归型时间序列数据的完全预测水库计算的数学结构
强调了递归神经网络中的输入和循环权重矩阵的隐藏结构，并证明这些结构在 AR 类型的时间序列数据中实现了完美预测。
PDF9 months ago
基于频域自回归建模的语音增强
通过自回归（AR）模型在子带语音信号的频域中分离包络和载波部分，提出了一种改善语音质量和 ASR 性能的语音去混响统一框架，设计了基于双路径长短期记忆（DPLSTM）模型的神经网络结构，实现改善了子带包络和载波组件，进一步通过联合学习网络权
PDF9 months ago
迈向多样且一致的字体生成
本文考虑对给定的图形文档进行生成多样的排版风格的排版生成任务，并将其形式化为针对多个文本元素的细粒度特征生成，建立自回归模型以生成与输入设计背景相匹配的多样排版风格。此外，我们提出了一种简单而有效的采样方法，以尊重排版的一致性和差异性原则，
PDF10 months ago
无明显驱动源控制角色动作
如何生成多样、逼真且无限长的头部 / 身体序列，没有任何驾驶源？我们提出了一个基于 VQ-VAE 和经过精心设计的奖励函数使用强化学习训练的新型令牌级控制策略系统框架，可以注入高级先验模型以生成无限长和多样化的序列，能够显著解决累积误差导致
PDFa year ago
生成式检索中的学习排序
提出了一个称为 LTRGR 的新框架，结合了生成式检索和经典的学习 - 排序模型，通过使用段落排名损失训练自回归模型，只需要额外的训练步骤即可增强当前的生成式检索系统，并在三个公共数据集上实现了最先进的性能。
PDFa year ago
ICML后见之链中崛起的代理变形机
本文利用 “chain of hindsight” 方法在强化学习中训练了一个能够直接综合多个轨迹信息的 transformer 模型，并通过在 D4RL 和 ExoRL 基准测试中的表现证明了它的竞争力和可伸缩性。
PDFa year ago
语言模型的元学习在线适应
通过元学习的方法，提出了一种称为 Context-aware Meta-learned Loss Scaling (CaMeLS) 的在线微调算法，可以显著提高大语言模型对文本知识的保留能力。
PDFa year ago
使用几何感知自回归模型（GAAMs）对新的量热器几何形状进行普适模拟
我们开发了一种几何感知的自回归模型，可以更快地生成粒子物理中探测器响应的样本，且不需要额外的训练数据，此模型能够取代目前为加速器计算量设计的数百个生成模型，将成为未来探测器的重要工具。
PDFa year ago