利用字符串核和词嵌入进行自动化论文评分
一篇介绍用于 2017 年原生语种识别共享任务的机器学习方法的论文,该方法组合了几个内核(包括从文章或演讲转录中提取的字符 p-grams 和音频记录的低维表示),并使用核判别分析(KDA)来分类。使用该方法,研究团队在不同的竞赛分类中获得了优异的得分(达到了最好的口语和混合跟踪的得分),证明了该方法的有效性。
Jul, 2017
本文介绍了两个手动注释的芬兰本科学生论文数据集,旨在评估几种基于深度学习嵌入方法对支持论文评分的句子聚类的适用性。发现选择最合适的方法取决于试题和答案的性质,深度学习方法能够但不能保证在词汇重叠上的简单方法之上表现更好。
Apr, 2021
本文研究了使用简单而有效的传导学习方法以及自我训练方法来优化字符串核技术在一些文本分类任务中的表现,并通过将字符串核适应于测试集中的样本,取得了在英语情感极性分类和阿拉伯语方言识别中显著更好的准确率。
Aug, 2018
本文研究学习者文章中句子级提示相关性评估的任务,在两个学习者写作数据集上评估使用单词重叠、神经嵌入和神经合成模型的各种系统。我们提出了一种新的句子级相似度计算方法,该方法学习调整针对特定任务的预训练单词嵌入的权重,相较于其他相关基线模型,实现了显著更高的准确性。
Jun, 2016
本文提出了一种使用回译和分数调整来增加论文 - 评分对数目的方法,并将其应用于 Automated Student Assessment Prize 数据集进行扩充,通过使用先前工作中的模型对增强数据的有效性进行了评估,并使用长短期记忆进行了性能评估,该模型广泛用于自动文章评分。使用增强数据来训练模型可以提高模型的性能。
Mar, 2022
研究应用单词嵌入作为分类特征在大规模文本分类中的整合,并考察不同的高效组合函数及其与传统的 one-hot 编码表示相结合的效果。最终,通过实证研究表明这种组合方式在大型多类多标签分类问题中的效率和性能都得到了显著提升。
Jun, 2016
本文利用基于核函数的学习方法相结合的特征提取方法来进行 2018 年复杂单词识别 (CWI) 共享任务,并且在英语维基百科数据集上获得了较好的结果.
Mar, 2018
我们开发了两个模型,通过对两个大型数据集进行微调和其他策略,自动评分英文文章的多个维度,结果显示我们的系统在精确度、F1 得分和 Quadratic Weighted Kappa 三个标准下取得了卓越的性能,并且在整体评分中优于现有方法。
Jun, 2024