Feb, 2024

学习曲线建模及其在词性标注中的应用

TL;DR基于部分结果和功能策略,引入了一种算法来估计整个训练数据库中学习曲线的演变,迭代逼近所需时间的值,独立于学习技术的使用,并且在经过预测级别后,被证明在工作假设方面是正确的,使用户能够根据最终可达到的准确性设定收敛阈值的概念扩展,即使存在扭曲观测也似乎是有效的。我们的目标是评估培训工作量,支持决策制定,以减少在学习过程中对人力和计算资源的需求。该提案在至少三个操作过程中是有意义的,第一个是预测准确性的提升,以衡量达到一定性能水平所需的工作量,第二个是在训练时间内比较系统的效率,以仅完成最适合我们要求的系统的任务,同时准确性的预测也是定制系统的有价值信息,因为我们可以预先估计设置对性能和开发成本的影响。通过生成词性标注器作为示例应用程序,实验结果与我们的预期一致。