BriefGPT.xyz
Ask
alpha
关键词
downstream model performance
搜索结果 - 3
COLING
extit {Tokenization and the Noiseless Channel}》两个反例
通过分析两种变体的 BPE 分词方法,本研究揭示了用 Rényi 效能作为分词度量指标的局限性,为构建更准确的预测器提供了启示。
PDF
4 months ago
基于 LLM 的文本增强中多样性激励对样本多样性和下游模型性能的影响
最新的生成型大规模语言模型(LLM)被应用于数据增强任务,在这些任务中使用少量文本样本进行 LLM 重述,然后用于模型的微调。本研究调查了三种在众包中广泛使用的文本多样性激励方法:禁忌词、先前异常解决方案的提示和先前异常解决方案的链接,并使
→
PDF
6 months ago
ACL
分词和无噪声信道
本文研究了子词分割在自然语言处理中的应用,发现利用 Rényi 熵而非 Shannon 熵可以提高机器翻译的效果。
PDF
a year ago
Prev
Next