BriefGPT.xyz
Ask
alpha
关键词
synthetic dataset generation
搜索结果 - 4
利用 10 个黄金标签从零开始训练最佳 IR 模型的自动优化训练超参数
我们开发了一种使用少于 100M 参数的小规模神经信息检索模型进行训练的方法,仅需 10 个金标准相关性标签。该方法依赖于使用语言模型生成文档的合成查询,并且关键步骤在于根据训练质量自动优化生成这些查询的 LM 提示。在 BIRCO 基准测
→
PDF
19 days ago
强制语言模型排除扩散分布
今天的语言模型在随机输出方面表现不佳,本文提出了一种微调方法,鼓励语言模型产生分散的输出分布,使大型语言模型在合成数据集生成方面变得更实用。
PDF
3 months ago
使用概率组合贝塞尔曲线生成多步轨迹预测的综合地面真实分布
通过使用基于组合概率贝塞尔曲线的新颖方法进行合成数据集生成,本文展示了使用生成的地面真实分布数据进行示例轨迹预测模型评估。
PDF
3 months ago
MM
基于机器学习的非直射地面通信定位方法:输入表示和不确定性估计
本文探讨了非直线视距(NLOS)定位中使用三种不同的输入表征(单无线电路径特征、无线电链路特征和基于图像的表征)以及两种卷积神经网络,并测量了各种特征的可用性对模型性能的影响。该研究的收获在于激发了未来构建更高效神经网络的工作,并提供了对
→
PDF
a year ago
Prev
Next