利用词汇和上下文信息预测州立法行动的可预测性

Jun, 2018

利用词汇和上下文信息预测州立法行动的可预测性

How Predictable is Your State? Leveraging Lexical and Contextual Information for Predicting Legislative Floor Action at the State Level

HTML

PDF

Vlad Eidelman, Anastassia Kornilova, Daniel Argyle

TL;DR该研究主要通过使用超过100万份法案的词汇内容和上下文引导来构建预测模型，探究了影响美国50个州和华盛顿特区立法成功的因素，并展示了这些信号的互补预测能力。

Abstract

Modeling U.S. Congressional legislation and roll-call votes has received significant attention in previous literature. However, while legislators across 50 state governments and D.C. propose over 100,000 bills each year, and on average enact over 30% of them, state level analysis has received relatively less attention due in part to the difficulty in obtaini

发现论文，激发创造

Gov2Vec: 学习机构及其法律文本的分布式表示

使用唯一向量空间嵌入法比较不同机构之间的政策差异，发现各机构之间存在有意义的差异，并使用文法向量回答具体问题，正在扩展为更综合的法律语义地图。

Sep, 2016

Party Matters: 利用作者属性增强立法嵌入以进行投票预测

研究如何通过添加发案人的意识形态将议案文本与神经网络模型相结合，从而提高预测新上任议员投票结果的准确率。

May, 2018

BillSum：美国立法的自动摘要语料库

本文针对美国国会和加州州政府发布的众多议案进行了研究，推出了第一个用于议案自动摘要的数据集-- BillSum。文章介绍了该数据集的属性，对比了不同的提取方法，并证明了基于国会议案的模型能够应用于对加州议案的自动摘要。

Oct, 2019

预测和分析肯尼亚的立法

本文旨在研究肯尼亚双院制议会引入的提案，并通过提取自提案中的特征，开发和训练机器学习模型来预测提案是否会获得立法。该实验观察到，相较于提案中的文字内容，提案引入的时间及类别更加相关。

Jun, 2020

使用已注释和增强的议案语料库学习议案相似度

本文介绍一个使用 BERT 变体和多阶段训练来预测法案相似性的方法，发现在使用人类标注和合成数据进行训练时，预测性能显著提高，并成功捕捉了各种层次的法律文件之间的相似性。

Sep, 2021

在美国国会中区分主动和被动的共同赞助

该研究发现美国国会议员使用有积极和消极两种推动议案的方式，与政治同僚和议案内容的支持有关。为此，开发一种基于编码器和RGCN的模型，通过议案文本和演讲转录学习议员代表并预测积极和消极的联合赞助度。应用这些议员代表预测投票结果，结果具有可解释性并且适用于未知任务。

May, 2022

DeepParliament：议会法案预测的法律领域基准和数据集

DeepParliament是一份涵盖自1986年至今的议案文件和元数据、执行各种议案状态分类任务的法律领域基准数据集，其中提供了更完整的议会法案内容信息。该文提供数据收集、详细统计和分析，并提供了二进制和多类议案状态分类的新基准模型，该模型可用于协助议员、总统和法律从业者审查或优先处理议案，提高决策的质量和减少时间消耗。该工作将首次呈现议会法案预测任务，并公开了代码和数据集，以提高法律AI资源的可访问性和促进可重现性。

Nov, 2022

大型语言模型作为公司游说者

用大型语言模型辅助企业游说，帮助识别相关立法并草拟游说信，引发对人工智能游说的界限问题。

Jan, 2023

议会会议中的多语种情感识别训练数据集ParlaSent

本文介绍一种基于情感分析的新数据集以及依此数据集进行的一系列实验，重点是训练一个强大的情感分类器用于议会会议。此外，还引入了第一个领域特定的LLM（语言模型）用于政治科学应用，并在27个欧洲议会的会议记录中进行了1.72亿专业领域词汇的预训练。通过实验证明，LLM在议会数据上的额外预训练可以显著提高模型的性能，尤其是在情感检测等具体领域任务上。同时，该研究显示多语言模型在未知语言上表现良好，并且来自其他语言的额外数据显著提高了目标议会的结果。本文对社会科学的多个领域做出了重要贡献，并将其与计算机科学和计算语言学相结合。最后，它建立了一种更可靠的政治文本情感分析方法，使学者能够使用标准化的工具和技术，从比较的视角研究政治情感。

Sep, 2023

大型语言模型进行政策文件的多类别分类

使用GPT 3.5和GPT 4模型对议会法案和听证会进行分类，与人工干预程度相关的三种使用情景中，我们的结果表明完全依赖最小化人工干预的GPT不够充分，人工投入程度越高准确性越高，并在最需要人工干预的情况下取得了令人惊讶的高准确率。然而，优秀的使用情景中的83%准确率仅在两个模型达成一致的65%数据上实现，暗示着类似我们的方法相对容易实施，并可实现对大多数给定数据集的自动编码，从而节省资源并降低成本。

Oct, 2023