- 关于分类器在各种测试条件下的排名,Softmax 概率告诉我们什么?
本研究旨在发展一种能准确评估各种分类器在来自未标记数据的离域分布上进行测试时的性能排名的度量方法。通过展示常规的不确定性度量方法,特别是最大 Softmax 预测概率,在某些离域环境下预测模型泛化的内在效用,我们首先介绍了一种名为 Soft - 通过 GSD-Front 进行统计多准则基准测试
通过借用鲁棒统计学和不精确概率的技术,本研究提出了一种可靠的方法来比较分类器,以满足不同质量指标、统计不确定性和基本假设的鲁棒性要求。
- 恶意软件数据依赖图特征的 kNN 分类
基于数据依赖图构造的特征表示进行分类,提高了分类准确度和可解释性,同时证明数据依赖图能够准确捕捉语义和结构信息。
- 通过带有动态命题的布尔公式实现全球可解释的分类器
提出一种从表格数据中提取可立即解释的人类可理解分类器的方法,并使用 Answer Set Programming 实现,其优点是分类器长度短且容易理解,与参考方法相比准确度相近。
- 最佳优化社交环境中的合作学习
协作学习中,网络代理以自己拥有的分类器通过交流或观察其他代理的预测进行动态更新,研究了在此情景中如何优化预测以提高整个网络的准确性,并提出了多项式时间算法和近似算法来实现优化的目标。
- AAAIDA-Net:多源跨语言迁移学习的解缠和自适应网络
多源跨语言迁移学习中,通过语言转移从多个标记的源语言传递任务知识到一个未标记的目标语言。本文提出了一种分离和自适应网络(DA-Net),通过反馈引导合作解缠方法清洁分类器的输入表示,从而减轻多个源的干扰;并提出了一种类别感知的并行适应方法, - 共情对话回复的多维度评估
提出了一个多维度的共情评估框架,该框架可以测量发言者表达意图以及听众感知到的共情,这两个维度之间存在相互关联,而感知到的共情与对话会话的满意程度有很高的相关性。为了自动测量对话中的共情,进行了不同的建模选项,包括使用预置的大型语言模型和基于 - 通过离散化和特征选择实现对表格数据的可解释分类器
用一种基于布尔分类器生成的方法,从表格数据中计算出既能直接理解,又准确的分类器。通过先将原始数据离散化为布尔形式,然后结合特征选择和一个非常快速的算法来生成最佳的布尔分类器。在 14 个实验中展示了该方法,其结果的准确性主要与随机森林、XG - 探索时间序列数据的层次分类性能:差异度量和分类器比较
对比了时间序列数据分析领域中层次分类(HC)和扁平分类(FC)方法的绩效,探究了不同数据集和分类器条件下,基于几种不同的相异度度量方式(JSD,TSD 和 CBD), 采用了 MINIROCKET,STSF 和 SVM 分类器,发现当采用 - 有机还是扩散型:我们能区分人类艺术和 AI 生成的图像吗?
生成对抗网络图像与人类创作之间的区分是个具有挑战性的问题,本论文通过使用监督学习的分类器以及艺术家使用其艺术技巧的方法,对现代生成模型的性能进行了研究,并分析了自动化检测器和人类团队的结合可以提供最佳的准确性和鲁棒性。
- 用反事实表示解释文本分类器
通过在文本表示空间进行干预的简单方法生成对抗事实,以用于分类器解释和偏见缓解。
- 高斯数据的统计子群公平性的多项式时间审计
我们研究了具有统计子群公平性概念的分类器稽核问题。在高斯分布和一些先前的工作中,我们采用了一种新的方法来审核均匀半空间子群的统计公平性,并获得了多项式时间逼近方案(PTAS),在通用半空间子群和高斯特征分布条件下,没有密码学假设可以保证任何 - 决策树从决策规则系统推理的贪婪算法
决策树和决策规则系统在分类器、知识表示工具和算法方面发挥重要作用。本文研究了这两个模型之间的关系,考虑了将决策树转换为决策规则系统的逆转换问题,并提出了一种基于贪婪多项式时间算法,在给定属性值元组上模拟决策树操作的方法。
- 多样性增强主动学习的均值适当得分的贝叶斯估计
提出了一种基于贝叶斯估计的增加严格适当得分的方法 BEMPS,用于在主动学习中估计严格适当得分的增加,该方法在实验证明了其较其他方法更强大和更具鲁棒性,并通过定性分析得到了支持。
- 加密货币涌入推特货币标签:一种分类解决方案
本研究提出了自动分类器来区分冲突的 $ 标签并通过分析涉及股票公司和加密货币的推文的独特特征来区分它们的容器推文。实验结果确认了当存在冲突或同音异义的 $ 标签时,所收集数据的显著失真。根据我们的结果,包括加密货币和股票公司标签的推文的独特 - 正样本未标记数据的单一样本对照抽样方法与病例对照抽样方法的比较:两种情景的故事
本文研究了基于经验风险最小化(ERM)的分类器在针对阳性无标签数据的情况下可能在单样本场景下显著退化的问题,并引入了针对单样本情况的非负风险分类器,比较了其性能与原始提案的差异。研究发现,在标记了一半或更多阳性观察值的情况下,它们之间存在显 - 一种预测规模较大数据集上分类器准确性的概率方法,基于小规模试验数据
通过使用高斯过程模型,我们提出了一种方法,可以在数据集大小增加时获取关于准确性或类似性能指标的概率推断,通过在六个数据集上的评估,我们发现我们的方法在错误、可能性和覆盖范围方面表现出色。
- 阴影不撒谎,直线不弯曲!生成模型暂不懂投影几何……
通过使用几种分类器只分析图像的几何特征,我们证明生成的图像具有与真实图像不同的几何特征,当前的生成器无法可靠地复制真实图像的几何属性。
- 机器学习中心电信号处理的最佳实践探索
应用下采样、归一化和滤波等方法,对不同的多标签心电图数据集进行处理,评估其对不同高性能时间序列分类器的影响,并发现低至 50Hz 的采样率可以产生可比较的结果。此外,除了样本率降低可以可靠地减少计算资源,但不会增加准确性以外,我们还发现最小 - 不带伤害的公平分类器
在关键应用中,分类器将决策推迟给人类至关重要。我们提出了一种事后方法,使现有分类器有选择地放弃对某些样本的预测。我们的放弃分类器被激励以在满足用户指定的组公平性定义时保持原始准确性,同时实现一组群体公平性的程度。为此,我们设计了一种整数规划