- 大规模语言模型生成中的幻觉检测:基于词元概率的方法
使用两个简单的分类器和从其他 LLM 评估器获得的四个数值特征,本文引入了一种监督学习方法,取得了有希望的结果,并在三个不同基准测试中超越了当前最先进的成果。
- OneChart:通过一个辅助标记提取纯净的图表结构
提出了一种可靠的代理 OneChart,用于图表信息的结构提取。通过引入辅助符号和额外的解码器,增强输出的数值部分的可靠性,并采用自我评估机制来衡量结果的可靠性,并在多个公共基准测试中显著优于当前一流的图表结构抽取模型。
- 基于表格数据的深度学习:一种自监督方法
使用自监督学习的 TabTransformer 模型,通过描述一种新颖的表格数据训练方法,提高了对分类和数值特征的建模能力。通过对比传统机器学习模型和自监督学习方法,研究结果显示 TabTransformer 在表格数据上的性能优势。
- DynamoRep:基于轨迹的人口动态算法用于黑盒优化问题分类
本文提出一种基于简单的描述性统计方法的特征提取方法,用于应用于机器学习模型分析优化算法。通过评估所生成的特征在黑盒优化基准测试套件中分类问题类的任务中的性能,我们得出了 DynamoRep 特征足以识别优化算法运行的问题类别的结论,实验结果 - 基函数编码因子分解机中的数值特征以提高准确性
本文介绍了如何通过将数值型特征编码为自己选择函数的一组函数值向量的方法,将数值特征合理地纳入线性因子机中,其中建议使用具有强大逼近能力的函数如 B-Spline,以提高实时推荐系统的性能。
- 面向所有时间序列的单一 Transformer:使用时间相关异构列表数据进行表征和训练
本文提出了一种 Transformer 架构以表示混杂的时间依赖型表格数据,其中数值特征使用一组频函数表示,并且整个网络使用唯一的损失函数均匀训练。
- 关于消息传递神经网络作为全局特征图变换器的表达能力
本文探讨了消息传递神经网络(MPNN)在转换其输入图中节点存储的数字特征方面的能力。我们引入了全局特征映射变换器(GFMT)的概念,并以 GFMT 的基本语言 MPLang 作为表现能力的标准。我们考虑了精确与近似表现力、任意激活函数的使用 - 表格深度学习中数字特征的嵌入
本研究针对数值特征在计算表格数据方面的表现,提出在深度学习中使用数值特征嵌入提升性能的方法,并重点研究两种不同的嵌入方式,并实现了嵌入在简单 MLP-like 模型与 attention-based 结构中的对比性能提升。
- CTR 预测中数值特征的嵌入式学习框架
本文提出了一种新颖的嵌入学习框架,用于 CTR 预测中的数值特征(AutoDis),其核心组件包括元嵌入,自动离散化和聚合,综合实验证明,AutoDis 可以提高 CTR 和 eCPM,代码公开可用于 MindSpore。
- KBLRN:具有潜在、关系和数字特征的知识库表示的端到端学习
KBLRN 是一个学习知识库表示的框架,使用神经表示学习和概率专家模型的新颖结合来整合潜在、关系和数字特征。通过将数字特征与知识库的表现形式相结合,KBLRN 超过了现有方法在知识库完成任务的一系列参数上的表现。