A typical domain adaptation approach is to adapt models trained on the
annotated data in a source domain (e.g., sunny weather) for achieving high
performance on the test data in a target domain (e.g., rainy weath
研究开放领域问答(ODQA)中,当应用于广泛不同的领域时,此类模型的稳健性和应用性能。该研究提出了一个更现实和具有挑战性的领域转移评估环境,并研究了端到端的模型性能。他们发现,不仅模型在推广方面表现出失败,且高检索分数通常也不能提供准确的答案预测。最后,研究提出并评估了多种干预方法,其提高了端到端答案 F1 得分,最多可达 24 个点。