Mar, 2022

利用序列标注式问答技术对代码和自然语言对的跨编程语言挖掘

TL;DR本研究提出一种序列标注的问答(SLQA)方法,旨在以一种不依赖于编程语言的方式挖掘自然语言和编程语言对。该方法应用BIO标注方案,统计分析和下游评估表明,自动挖掘的Lang2Code是进行进一步自然语言和编程语言研究的大规模高质量数据资源。