利用字符串核和词嵌入进行自动化论文评分

ACLApr, 2018

利用字符串核和词嵌入进行自动化论文评分

Automated essay scoring with string kernels and word embeddings

Mădălina Cozma, Andrei M. Butnaru, Radu Tudor Ionescu

TL;DR本文采用串核和词嵌入的方法对自动化论文评分进行研究，并结合语义特征表征和深度学习技术，在学生自动评估奖数据集上实现了最好的性能表现。

Abstract

In this work, we present an approach based on combining string kernels and word embeddings for automatic essay scoring. →

automatic essay scoring string kernels word embeddings semantic feature representation deep learning

发现论文，激发创造

字符串核函数在母语识别中是否经得起时间考验？

一篇介绍用于 2017 年原生语种识别共享任务的机器学习方法的论文，该方法组合了几个内核（包括从文章或演讲转录中提取的字符 p-grams 和音频记录的低维表示），并使用核判别分析（KDA）来分类。使用该方法，研究团队在不同的竞赛分类中获得了优异的得分（达到了最好的口语和混合跟踪的得分），证明了该方法的有效性。

Jul, 2017

论文评分支持中句子聚类的深度学习

本文介绍了两个手动注释的芬兰本科学生论文数据集，旨在评估几种基于深度学习嵌入方法对支持论文评分的句子聚类的适用性。发现选择最合适的方法取决于试题和答案的性质，深度学习方法能够但不能保证在词汇重叠上的简单方法之上表现更好。

Apr, 2021

通过适应测试集来提升字符串核算法在情感分析和阿拉伯方言识别中的结果

本文研究了使用简单而有效的传导学习方法以及自我训练方法来优化字符串核技术在一些文本分类任务中的表现，并通过将字符串核适应于测试集中的样本，取得了在英语情感极性分类和阿拉伯语方言识别中显著更好的准确率。

Aug, 2018

学生论文中细粒度的主题相关性评估的句子相似度测量

本文研究学习者文章中句子级提示相关性评估的任务，在两个学习者写作数据集上评估使用单词重叠、神经嵌入和神经合成模型的各种系统。我们提出了一种新的句子级相似度计算方法，该方法学习调整针对特定任务的预训练单词嵌入的权重，相较于其他相关基线模型，实现了显著更高的准确性。

Jun, 2016

使用反向翻译文章和调整分数来提高自动化论文评分的性能

本文提出了一种使用回译和分数调整来增加论文 - 评分对数目的方法，并将其应用于 Automated Student Assessment Prize 数据集进行扩充，通过使用先前工作中的模型对增强数据的有效性进行了评估，并使用长短期记忆进行了性能评估，该模型广泛用于自动文章评分。使用增强数据来训练模型可以提高模型的性能。

Mar, 2022

以词和句相似性重新思考评估

本文提出了 EvalRank 作为一种新的内部评估方法，它在 60 多个模型和流行数据集上进行了深入的实验，并释放了实用的评估工具包用于未来的基准测试。

Mar, 2022

自动作文评分的深度学习架构

基于循环神经网络和卷积神经网络的自动评测系统在 8 个数据集上实验表明，本系统在自动评测方面具有显著的优势。

Jun, 2022

使用 skip-gram 嵌入的大规模文本分类的实证研究

研究应用单词嵌入作为分类特征在大规模文本分类中的整合，并考察不同的高效组合函数及其与传统的 one-hot 编码表示相结合的效果。最终，通过实证研究表明这种组合方式在大型多类多标签分类问题中的效率和性能都得到了显著提升。

Jun, 2016

UnibucKernel: 用于复杂词语识别的基于核的学习方法

本文利用基于核函数的学习方法相结合的特征提取方法来进行 2018 年复杂单词识别 (CWI) 共享任务，并且在英语维基百科数据集上获得了较好的结果.

Mar, 2018

使用微调和多元回归的自动作文多维评分

我们开发了两个模型，通过对两个大型数据集进行微调和其他策略，自动评分英文文章的多个维度，结果显示我们的系统在精确度、F1 得分和 Quadratic Weighted Kappa 三个标准下取得了卓越的性能，并且在整体评分中优于现有方法。

Jun, 2024