- 基于人工智能的客服票分类:现状和 AutoML 实施
自动化技术在支持票据分类中的应用性测试研究表明,自动化机器学习(AutoML)可用于训练具有良好分类性能的机器学习模型(ML 模型),并填补了在不借助专业人员利用 AutoML 开发 AI 解决方案方面的研究空白,进而使该技术更容易为没有专 - 非线性福利感知战略学习
本文研究在存在战略个体行为的情况下的算法决策,其中使用机器学习模型作出对人类个体的决策,而后者可以战略性地调整自己的行为以改进其未来的数据。研究重点在于非线性设置,其中个体只能通过决策策略的本地信息来响应决策策略。同时考虑最大化决策者福利( - 机器学习中的语音信号处理:说话人隔离案例
通过对傅里叶变换和小波变换等信号分解方法的简洁比较分析,讨论了衡量语音可懂度的指标,并提供了数学定义和直观解释,以帮助机器学习工程师在选择、调整和评估特定机器学习模型的分解方法时做出明智决策。
- 人工智能加速云 (ACAI)
提出了一种基于云端的机器学习平台 ACAI,通过实现云端存储、自动资源配置、日志记录和实验追踪等功能,提高了机器学习从业人员的工作效率。在 MNIST 手写数字分类任务上测试了自动资源配置器的效力,并通过实验和访谈研究了系统的可用性。结果显 - 特征选择的二进制特征掩码优化
我们提出了一个新颖的框架,通过考虑模型的预测结果来选择特征。我们使用一种新颖的特征屏蔽方法,在选择过程中消除特征,而不是完全从数据集中删除它们,从而可以在特征选择过程中继续使用同一 ML 模型。我们通过 ML 模型的预测结果获得屏蔽运算符, - GEVO-ML: 使用进化计算优化机器学习代码
GEVO-ML 是一个工具,用于自动发现 ML 内核的优化机会和性能调优,在多层中间表示(MLIR)中统一表示模型和训练 / 预测过程,使用多目标进化搜索来改进在 GPU 上运行的 MLIR 代码的性能,而保持所需功能。
- 机器学习模型的经济高效再培训
优化机器学习模型重新训练的成本,通过考虑数据、模型和预测查询等多种因素,提出了一种成本感知的重新训练算法 Cara,该算法能适应不同的数据变化并在总成本更低的情况下实现比漂移检测基线更好的准确性。
- BotArtist:基于 Twitter 封禁的机器学习模型的 Twitter 机器人检测
采集了一份大规模的多语言社交话语 Twitter 数据集,并通过 Twitter API 和 Botometer 提供的已带标签的 Twitter 账号数据集与另外两个热门话题(即 2022 年能源危机和阴谋论讨论)来检测 Twitter - 结肠镜检过程的半监督质量评估
本文提出了基于 ML 模型的在线和离线质量度量标准,该模型学习了视觉外观质量标准,并评估了检测到已知息肉的可能性,以证明所提出的度量标准与息肉检测的灵敏度高度相关。这些度量标准可以实时提供质量反馈给医生,这对于肠镜检查中错过的息肉数与检测质 - 深度学习应用中的分层推理在线算法
研究了嵌入小型机器学习模型的资源受限边缘设备与托管大型机器学习模型的边缘服务器之间的 Hierarchical Inference 策略,提出了在线元学习框架,以预测小型模型的分类猜测正确性,并使用四个数据集对其性能进行了评估。
- Boosted Trees 的归纳解释计算
介绍了一种用于 Boosted Tree 模型中的推导解释生成的新方法,称为树特定解释,可以在多项式时间内计算,实验证明该方法具有较高的可扩展性。
- 机器教学中的人工智能交互设计
本文基于现有工作,提出了一个包括教学界面、机器学习器和知识库在内的机器教学框架,并着重关注实现教学界面所涉及的人工智能交互设计。在师生对话中,阐述了开发机器教学系统时需要处理的设计决策。
- 预测过程监控结果可解释性:你能看到我的数据问题吗?
本文探讨了预测业务流程监控(PPM)中不同设置对 ML 模型的影响,并研究了导致生成不同解释的原因。
- 数据如何与您的模型互动学习:执行梯度下降
该研究论文介绍了一种新的算法 PerfGD,通过捕捉模型对数据分布的影响来优化模型参数,为解决通过部署机器学习模型改变数据分布引起的性能问题提供了新的解决方案。
- 统一特征归属和反事实说明:不同的手段达成了相同的目的
通过真实因果关系框架提供一种将特征归因和反事实解释统一的解释方法,通过在 Adult-Income,LendingClub 和 German-Credit 三个基准数据集上的实验,发现 Feature attribution 方法和 cou - KDDActive Learning++:利用本地模型解释包含标注者原因
研究提出一种新的主动学习框架,称为 Active Learning++,其可以利用注释者的标签以及其理由,通过修改基于 Bagging 的 Query by Committee (QBC) 采样策略的不一致度量方法,将委员会模型的权重分配给