利用词汇和上下文信息预测州立法行动的可预测性
使用唯一向量空间嵌入法比较不同机构之间的政策差异,发现各机构之间存在有意义的差异,并使用文法向量回答具体问题,正在扩展为更综合的法律语义地图。
Sep, 2016
本文针对美国国会和加州州政府发布的众多议案进行了研究,推出了第一个用于议案自动摘要的数据集-- BillSum。文章介绍了该数据集的属性,对比了不同的提取方法,并证明了基于国会议案的模型能够应用于对加州议案的自动摘要。
Oct, 2019
本文旨在研究肯尼亚双院制议会引入的提案,并通过提取自提案中的特征,开发和训练机器学习模型来预测提案是否会获得立法。该实验观察到,相较于提案中的文字内容,提案引入的时间及类别更加相关。
Jun, 2020
本文介绍一个使用 BERT 变体和多阶段训练来预测法案相似性的方法,发现在使用人类标注和合成数据进行训练时,预测性能显著提高,并成功捕捉了各种层次的法律文件之间的相似性。
Sep, 2021
该研究发现美国国会议员使用有积极和消极两种推动议案的方式,与政治同僚和议案内容的支持有关。为此,开发一种基于编码器和RGCN的模型,通过议案文本和演讲转录学习议员代表并预测积极和消极的联合赞助度。应用这些议员代表预测投票结果,结果具有可解释性并且适用于未知任务。
May, 2022
DeepParliament是一份涵盖自1986年至今的议案文件和元数据、执行各种议案状态分类任务的法律领域基准数据集,其中提供了更完整的议会法案内容信息。该文提供数据收集、详细统计和分析,并提供了二进制和多类议案状态分类的新基准模型,该模型可用于协助议员、总统和法律从业者审查或优先处理议案,提高决策的质量和减少时间消耗。该工作将首次呈现议会法案预测任务,并公开了代码和数据集,以提高法律AI资源的可访问性和促进可重现性。
Nov, 2022
本文介绍一种基于情感分析的新数据集以及依此数据集进行的一系列实验,重点是训练一个强大的情感分类器用于议会会议。此外,还引入了第一个领域特定的LLM(语言模型)用于政治科学应用,并在27个欧洲议会的会议记录中进行了1.72亿专业领域词汇的预训练。通过实验证明,LLM在议会数据上的额外预训练可以显著提高模型的性能,尤其是在情感检测等具体领域任务上。同时,该研究显示多语言模型在未知语言上表现良好,并且来自其他语言的额外数据显著提高了目标议会的结果。本文对社会科学的多个领域做出了重要贡献,并将其与计算机科学和计算语言学相结合。最后,它建立了一种更可靠的政治文本情感分析方法,使学者能够使用标准化的工具和技术,从比较的视角研究政治情感。
Sep, 2023
使用GPT 3.5和GPT 4模型对议会法案和听证会进行分类,与人工干预程度相关的三种使用情景中,我们的结果表明完全依赖最小化人工干预的GPT不够充分,人工投入程度越高准确性越高,并在最需要人工干预的情况下取得了令人惊讶的高准确率。然而,优秀的使用情景中的83%准确率仅在两个模型达成一致的65%数据上实现,暗示着类似我们的方法相对容易实施,并可实现对大多数给定数据集的自动编码,从而节省资源并降低成本。
Oct, 2023