云市场谈判的信念 - 欲望 - 意图(BDI)多智能体系统
提出了一种基于模糊逻辑的基于代理的自动协商资源调度系统,通过引入综合性协商游戏,根据协商结果对资源进行调度,从而达到更高效地利用资源的目的,并成功使用机器学习模型替代模糊协商系统以提高处理速度。
Feb, 2024
本文讨论了如何利用多智能体强化学习进行实时广告优化,提出了一种聚类算法分配策略代理,并通过行业实验表明,与单一代理和实验算法相比,基于聚类的竞价模型具有更好的效果。
Feb, 2018
该研究探讨了动态机制设计问题中的信息诱导与承诺机制问题,提出了贝叶斯承诺机制 (BPD) 以及相关的信念层次结构与诱导机制,确保了该机制的周期性激励兼容性,求得了最优社会福利。
Jan, 2022
我们提出了一种新颖的用于在线市场的谈判对话代理,该代理具有谈判价格以及添加或删除商品等其他因素的能力,从而提供了更灵活和全面的谈判体验。通过创建 Integrative Negotiation Dataset (IND) 数据集,我们引入了一种新的半自动数据创建方法,结合用户和代理之间的定义谈判意图、行动和意图 - 行动模拟,生成潜在的对话流。使用 GPT-J 作为提示生成给定意图的对话,通过人机协作的方式进行后期编辑和修正,以确保数据质量。通过采用针对谈判任务量身定制的一组新颖奖励,我们训练了名为 Integrative Negotiation Agent (INA) 的谈判代理。这些奖励激励聊天机器人学习有效的谈判策略,以适应不同的上下文需求和价格提案。通过运用 IND,我们训练了我们的模型并进行实验,评估了我们基于奖励的对话系统在谈判中的有效性。我们的结果表明,所提出的方法和奖励系统显著提升了代理的谈判能力。INA 成功进行了综合谈判,展示了动态调整价格以及在捆绑交易中谈判商品的能力。
Oct, 2023
本文提出一种使用智能电表数据和功能,同时确定投标和购买策略,基于历史招标经验学习的双代理深度确定性策略梯度方法来优化招标和购买决策,并通过在线学习确保趋势跟踪和自适应,结果表明该模型可以通过离线 / 在线学习投标规则并稳健地进行适当的出价,在面对多种情况时获得最优利润。
Feb, 2022
本文提出了一种基于 Bayesian Delegation 的分散式多智能体学习机制,通过逆向规划实现智能体对他人潜在意图的快速推断,实现协调和合作,展示在多智能体马尔可夫决策过程中的成功应用。
Mar, 2020
提出了一种名为 IDEAL 的智能设备 - 云参数请求模型,其可以检测数据领域外的请求收入来保证高收益的自适应设备 - 云通信,利用协作学习和动态模型来实现高效的设备 - 云协作和动态推荐。实验结果表明 IDEAL 在四个公共基准测试中具有有效性和一般性。
Feb, 2023
本文通过引入基于 RNN 的 DDQL 技术和基于 water-filling 算法的服务放置方法,解决了网络云集成环境中的服务放置和资源分配问题,从而实现在 B5G 中动态用户、超低延迟服务的放置以及用户迁移时的服务连续性的优化。
Sep, 2023