讲座一题目:Time Consistency in Dynamic Cooperative Games with multipe optimal trajectories
主 讲 人 :哈尔滨工业大学 李寅 副教授
主 持 人 :伟德国际1949官网 徐选华 教授
摘 要:
In this study we consider the time consistency of multi-stage cooperative games in which there are multiple optimal trajectories with complete information. In dynamic cooperative games, an important condition for the distribution of players' payoffs is that individual rationality needs to be satisfied. If the players' payoffs do not satisfy individual rationality as the game progresses along the cooperative trajectory, some players may deviate from the cooperative trajectory. If there are multiple optimal trajectories in the multi-stage game, the situation is further complicated by the fact that the players' payoffs always satisfy individual rationality on some of the optimal trajectories, but not on others. Alternatively, players' individual rationality conditions are quite different along different optimal trajectories.
Therefore, four different scenarios of multi-stage cooperative games with multiple optimal trajectories are set up in the study and analysed for each of the four different situations. Four different Payoff Distribution Procedure (PDP) formulations are proposed to modify the players' payoff distributions so that the game satisfies time-consistency on different optimal trajectories. Several theorems are given, and proofs are provided, with corresponding examples.
李寅,俄罗斯圣彼得堡国立大学(Saint Petersburg State University)应用数学与过程控制系博士,圣彼得堡国立大学人工智能和数据科学研究中心研究员及切比雪夫实验室计算机系科学委员会委员,现任哈尔滨工业大学数学学院副教授。曾受中国留学基金委公派博士留学,前华为科技有限公司圣彼得堡研究所自动驾驶网络实验室高级工程师(2019-2022),ICM2022国际数学家大会卫星会议Game Theory and Applications组织委员会成员。曾主持完成俄联邦教育部推荐至清华大学在线平台的课程项目。师从国际知名博弈论学者Leon Petrosjan院士,主要从事动态合作博弈、网络博弈及多智能体深度强化学习等方面的研究。
主 讲 人 :俄罗斯圣彼得堡国立大学 Ovanes Petrosian 教授
Ovanes Petrosian,俄罗斯圣彼得堡国立大学应用数学与过程控制系教授、人工智能与数据科学研究中心主任,哈尔滨工业大学讲席教授(可授予外国专家的最高职称)。前华为公司圣彼得堡研究所自动驾驶网络实验室技术负责人。于2017年获得圣彼得堡国立大学博士学位,2022年获得圣彼得堡国立大学正博士学位(系三十年来该校最年轻获得正博士学位者),近年在许多国际权威期刊发表学术论文10余篇及多篇会议论文和工作论文,多次在国际会议、研讨会作报告,并担任多个国际知名期刊审稿人,于2016年获得俄罗斯总统奖学金(每年全俄共10名获奖人)。研究兴趣包括:可解释AI,机器学习,强化学习,合作博弈,控制理论,连续更新的逆控制问题,连续更新的控制问题与微分对策,时间一致性问题。