体育语言中的非标TAM标记：文体分类预测

Jun, 2021

体育语言中的非标TAM标记：文体分类预测

Genre determining prediction: Non-standard TAM marking in football language

Jakob Egetenmeyer

TL;DR德语和法语的足球语言显示出与其他类型不同的时态-相态-情态(TAM)，分别是现在式代替过去式虚拟语气和完整过去式代替未完成过去时等，这些现象在足球比赛报告中具有特定的功能和语境，在理解这些现象时可能需要考虑文体、修辞关系和其他TAM表达方式之间的互动。

Abstract

German and French football language display tense-aspect-mood (TAM) forms which differ from the TAM use in other genres. In German football talk, the present indicative may replace the pluperfect subjunctive. In

发现论文，激发创造

过去，现在，未来：1000种语言时态类型的计算机研究

使用超级平行语料库，我们提出了一种分析低资源语言的分析方法SuperPivot，该方法在对语态的跨语言分析中表现良好，并对1000多种语言进行了分析

Apr, 2017

翻译中体裁和方法差异的语言学特征：计算视角

本文利用文本分类方法研究英德翻译语料库的类型和方法变化，使用基于词性标注的特征的组合，包括二元组、三元组和四元组，采用拉普拉斯平滑的贝叶斯分类器。使用分类器的输出对不同类型和翻译方法的主要区别进行了广泛的特征分析。

Sep, 2017

跨文体的状态性：一种分布式语义学方法

研究动词词汇体现出的语态对于文本蕴涵和学习语篇层推断至关重要。我们使用分布语义学有效地模拟了动态类别的两个基本维度，状态与事件以及目的性与非目的性事件。我们发现动词的本地上下文最能表明其语态，并证明封闭类词往往比内容词更具区分能力。我们的方法优于先前的三个数据集。最后，我们提供了一个由人-人对话注释的词汇视角数据集，并呈现实验结果，表明终止性与文本体裁和话语目标的相关性。

Oct, 2020

SOCCER：体育评论领域信息稀缺的话语状态跟踪集合

本文提出了一个新的任务制定，旨在利用足球比赛的实时解说识别发生在比赛中的事件，验证了将体育赛事作为自然语言理解和状态追踪的简单、完全可观测系统的可行性，并证明在定义宽泛的状态或非事件交谈变得流行时，即使对于先进的现有方法，如具有时间依赖性的句子分类和当前最先进的生成模型在状态跟踪任务上仍然具有挑战性。

Jun, 2021

语义歧义的因果结构

本文提出了一个新的sheaf论述模型，用于分析语义歧义的消岐过程。研究表明，在歧义短语中，从主语到动词和从宾语到动词是两种最常见的消岐顺序，并且使用这一模型进行了测试。同时，我们发现多义词和同音异义词的消岐过程存在延迟。

Jun, 2022

词汇和语法层面的介绍和调查计算方法

本文综述了计算模型在词汇和语法体貌方面的应用，重点探究静态性、目的性、习惯性、完成、未完成等方面的概念和影响，强调语义学在人类语言理解中的重要性及其在自然语言处理中的重要性。

Aug, 2022

走向目标：基于场景的足球评论资源

本文提出了GrOunded footbAlL commentaries（GOAL）数据集，该数据集包括了足球视频以及相应的英语实况解说文本，用于探究动态语言上下文，进一步提供了诸如帧重排序、时刻检索、实况解说检索、以及实况解说生成等四项任务的最新基线模型。实验结果表明，在大部分任务上，模型表现良好。

Nov, 2022

在11种语言中测试惊奇理论的预测

通过对11种不同语言进行研究，我们发现惊奇理论与阅读时间之间存在跨语言的联系，验证了三个预测：惊奇度是否预测阅读时间、预期惊奇度是否预测阅读时间、以及惊奇度与阅读时间之间的联系是否是线性的，从而在更多语言上提供了信息论与递增语言处理之间至今最强大的连接。

Jul, 2023

FootGPT：基于简单环境的大型语言模型开发实验

通过使用低阶适应的方法，我们在基于意大利足球联赛前十轮的球队统计数据上进行了一个十亿参数规模的通用因果语言模型的微调，结果观察到在开发特定目的的语言模型时，数据集内容和训练策略比起神经网络参数数量、训练时长或数据集大小更为重要。

Aug, 2023

关于法语书面文本中的情感识别：以其表达方式为视角进行文本复杂性分析的一步

预测文本中句子是否表达情感，表达方式，句子的复杂性以及情感类别，并通过使用数据集和模型，将情感的不同表达方式整合进自然语言处理中。

May, 2024