成语语料库构建的众包游戏化
本文研究表明,由习语或比喻语言训练的开放域对话系统能够更好地生成与包含习语提示相符的回复,通过利用潜在习惯表达(PIE)- 英语习语语料库,我们实现了 98%F1 宏分数的准确率和更好的会话回复效果,为公众贡献了模型检查点 / 演示和代码。
May, 2022
本文介绍使用众包技术对补全强制现象进行注释的方法,提出了显式补全和自然语言推断两种任务,但是在众包过程中得分较低,通过分析本研究的建模方案和与以前研究的不同之处,我们得出结论,该现象需要量身定制的解决方案,不仅需要专业算法,还需要特定的数据收集方法。
Oct, 2020
本研究探讨了如何使用极其嘈杂的众包注释构建一个低成本的数据集,并通过注释器适配器模型和相关混合策略,提高了众包建模的准确性,结果表明众包在观点表达识别方面有很高的应用前景。
Apr, 2022
本文以多项选择问题回答为测试基础,运用随机实验、数据收集协议及专家评估对比效果,发现训练众包工作者并采用迭代数据收集、传递回馈、基于专家判断进行筛选更为有效,但将普通众包判断及回馈替换为专家判断及回馈则效果不佳,最终观察到具有专家评估的迭代协议数据等级高于基线协议数据,并且人 - 模型差距大约是基准协议数据的两倍。
Jun, 2021
本篇文章研究了一种新的文本生成应用 —— 成语句子生成,通过使用神经模型和心理语言学理论,该文章提出一种有效转化直接字面短语到相应成语短语的方法,该方法在新建数据集上表现突出,超过其他文本生成竞争基准模型。
Apr, 2021
使用大型语言模型开发的多语言习语知识库(IdiomKB)能够提高机器翻译模型的性能,通过检索习语的比喻含义,使较小的模型在翻译过程中得到更全面的理解。
Aug, 2023
本文研究了在线辅导平台上对话的困扰个体的情绪估计的主观评估任务,探讨了聚合评估者选择的策略,展示了一个简单的投票共识与优化聚合方法在这个任务中同样有效,并设计了一种机器学习算法来执行相同的任务。有趣的是,我们观察到了一个没有明确建模评估者主观性的机器学习算法,在评估最主要的情绪时与人类评估一样可靠。
Jun, 2019
本文描述了在计算机科学高等教育课程中采用众包技术作为作业的方法和经验教训。通过音乐的相关元数据,采用一种支持文化遗产领域众包的平台并使用语义网技术分析了众包结果。结果为机器学习模型提供了一个公开可用的标注数据集,并且在线调查的反馈得出了将众包技术纳入计算机科学课程的好处和挑战。
Jun, 2023