- 注意力并不总是所需之物:走向有效地分类特定领域的文本
本文探讨了在专业领域文本分类中,预训练语言模型(PLMs)的使用是否有必要,通过比较在三个文本分类数据集上的各种模型的效果,发现对于专业领域文本分类任务,使用线性 SVM 分类器可以提供一种相当的、便宜的、可重现的、可解释的替代方案。
- NeuroQL: 一种神经符号语言和用于主体间推理的数据集
介绍了一个新的 AI 任务和 Inter-Subjective Reasoning 的基线解决方案,利用 NeuroQL 数据集和 DSL,将自然语言中的 Inter-Subjective 信息自动翻译为神经符号代码,并成功结合了客观事实和 - 社会科学中词嵌入的评估
本文介绍了基于 37,604 篇开放获取的社会科学研究论文构建和评估词向量模型。在评估中,我们比较了特定领域和通用语言模型在语言覆盖、多样性和语义关系方面的差异。我们发现,即使词汇表的大小相对较小,所创建的特定领域模型覆盖了社会科学概念的大 - 基于自上而下的图书馆学习综合
该论文介绍了语料库引导的自顶向下合成,作为一种从某个特定领域语言(DSL)程序语料库中合成捕捉常见功能的库函数的机制。该算法直接从初始 DSL 原语中构建抽象,使用中间抽象的句法模式匹配来智能地剪枝搜索空间,并指导算法朝向最大程度捕捉语料库 - KSAT: 知识注入的自注意力变形器 —— 整合多个领域特定语境
通过使用来自相关领域的外部知识资源,在 KSAT 中引入了知识注入的自我关注层,从而实现了对多个领域特定上下文的集成。KSAT 提供了控制从数据中学习与从知识中学习之间的权衡的机制,并与其他知识注入基线相竞争,显着优于使用精调进行领域特定任 - RLang: 强化学习表达先验知识的声明式语言
RLang 是一种领域特定语言,用于为强化学习(RL)代理程序传递后台知识并加速学习。RLang 可以指定有关 MDP 每个元素的信息,我们提供了一系列 RLang 程序作为实例,并演示了不同 RL 方法如何利用其知识。
- 描述机器学习数据集的领域特定语言
该论文提出了一种具有社会关注的领域特定语言来描述机器学习数据集的结构以及数据出处的新方法,这将促进任何机器学习倡议来利用和从机器学习的数据中获益。
- 具有有限域约束增强的电子表格计算
本文介绍了如何通过将有限约束求解器与电子表格计算范例结合来扩展电子表格计算范例应用,介绍了一个框架,将电子表格中的每个单元格与有限域或约束关系相连。同时提供了特定于电子表格的约束,以帮助控制大型电子表格应用程序实现的可扩展性,并通过示例演示 - DPCL:规范规格说明书的语言模板
介绍 DPCL,一种基于 Hohfeld 法律框架的特定领域语言(DSL),用于规定高级政策(包括规范,合同等),旨在明确用于规范规范的语言应具备的一般要求。
- 使用可接受的神经启发式学习可微分程序
研究解决学习特定领域语言中表达的可微分函数的问题,通过将神经网络的不同类视为对程序空间的松弛,并在一系列分类任务中实例化遗传算法和分支界限搜索来发现自然解释和有竞争力的程序分类器。
- AAAIFew-Shot Bayesian Imitation Learning with Logical Program Policies
提出了一种表达逻辑组合方案的策略学习算法,该算法可以从少量样本中学习有趣的策略,具备较高的数据效率和计算效率,适用于训练数据稀缺且存在结构差异较大的任务。
- 合成双射透镜
使用 Optician 工具在具有丰富类型等价关系的语言中,为两个数据格式表示的正则表达式生成双向转换器,使两个方向可以写成单个表达式。
- 凸优化问题的重写系统
本文描述了一个用于将特定领域语言编写的优化问题转化为与低级别求解器接口兼容的形式的模块化重写系统。我们通过 reduction 来实现翻译,该方法接受问题类别并将该类别的实例转换为另一类别的等效实例。我们在 CVXPY 1.0 中实现了该系 - 使用有限树自动机合成数据完成脚本
本文提出了一种基于 PBE 的数据自动完成功能综合技术,并通过 DSL 和新颖的综合算法,生成了与输入输出示例一致的 DSL 程序,并将该方法实现在名为 DACE 的工具中。