Feb, 2024
公共卫生中动态不休、多臂老虎机任务的决策语言模型(DLM)
A Decision-Language Model (DLM) for Dynamic Restless Multi-Armed Bandit Tasks in Public Health
Nikhil Behari, Edwin Zhang, Yunfan Zhao, Aparna Taneja, Dheeraj Nagaraj...
TL;DR通过使用自然语言命令,提出了一种动态调整政策结果的决策语言模型 (DLM),该模型能够适应具有挑战性的公共卫生环境中的人流量调度任务。