- 自动化电子游戏测试的多智能体合作方法
自动测试计算机游戏是一个具有挑战性的问题,特别是当需要测试冗长的场景时。本文提出了一种合作多代理测试方法,并基于一个名为实验室招募的 3D 游戏的案例研究,对其性能进行了研究。
- 自动游戏测试的强化模仿学习
游戏开发的自动化测试是减少开发成本和提高效率的关键技术之一,EVOLUTE 是基于模仿学习的架构,结合了行为克隆和能量模型,它在射击和驾驶游戏中表现出更高的泛化能力和性能。
- 自动测试代码转换模型的功能属性
大型语言模型在不同编程语言之间进行翻译的过程中变得越来越实用,但关键问题在于生成的代码是否准确。本文提出了第一种用于自动进行功能属性测试的代码翻译模型的方法,并探讨了基于属性的代码翻译模型搜索过程,结果显示该方法能够有效检测流行代码翻译模型 - 命名实体识别系统的自动测试和优化
利用 TIN 进行自动测试修复 NER 系统的错误。在测试中,TIN 发现了 784 个可疑问题,其中 702 个是错误问题,并成功修复了 1,056 个 NER 错误。
- 数字双胞胎:提高自动驾驶测试的效率性的最好途径
通过引入数字同胞的概念,本研究提出一种新的模拟测试框架,该框架可以在多个通用模拟器上测试自动驾驶软件,并可以计算集成预测失败概率,并将失败仅在同胞之间达成一致时报告。研究结果表明,数字同胞的集成失败预测器优于每个单独的模拟器,可以帮助感兴趣 - 利用遗传微程序实现自动化软件测试的大路径覆盖
利用遗传编程技术开发出一种新的自动化软件测试框架,生成可以重复生成输入值的微程序,从而快速高效地探索软件元件的输入参数范围,同时可应用于多种软件系统。
- AAAI通过基于强化学习的人类化游戏风格生成实现自动玩测试
该论文介绍了 CARMI:一种配置可调的智能体,使用相对度量输入以模拟玩家的游戏风格,并能够在先前未见过的游戏关卡上操作。这种方法不需要完整的游戏数据轨迹,可通过少量人工数据训练,并可用于制作视频游戏的行为和平衡研究。
- CodeT:生成测试的代码生成
在本文中,我们提出了一种新方法 CodeT,利用预先训练的语言模型自动生成代码示例的测试用例,从而减少人工成本并增加测试场景的覆盖范围,最终实现基于生成的测试用例的代码解决方案选择。
- AEON: 自然语言处理测试用例自动评估方法
使用 AEON 工具对生成的测试用例进行语义相似性和语言自然度评估,从而提高测试用例的质量,最终帮助提高自然语言处理软件的准确性和稳健性。
- 使用好奇心驱动增强学习的自动 Web 测试
WebExplor 是一种自动化的端到端 Web 测试框架,采用基于好奇心的强化学习生成测试用例,满足时间逻辑关系,能够显著提高故障检测率和代码覆盖率。
- 自主驾驶汽车的正式场景测试:从仿真到现实世界
本文提出了一种基于形式化方法的智能汽车自动场景测试的新方法,结合仿真和实际测试,并通过实验验证形式化仿真可以有效识别可在跑道上运行的测试用例,仿真和真实世界之间的差距可以得到系统评估和弥合。
- 为单元测试用例学习有意义的断言语句
利用神经机器翻译技术的 Atlas,能够自动生成恰当的断言语句来评估主方法的正确性,可作为自动生成测试用例技术的补充和开发人员的代码补全支持。