作为博客文章的处女秀,我将简要介绍一下我的研究领域。从现在起,我将之命名为“人体运动轨迹的人工智能动画模拟”(Physically-Based Animation ,下文简称PBA)。
译注:
这篇文章最早是在Media看到的,文中,作者将这一方法命名为Physically-Based Animation,但稍后却不知为何删除了Media上的文章,于是我们找到了作者的博客,在上面找到了这篇文章,但在博客中,这一方法被描述为Procedural Animation,即程序性动画。我个人较愿意以最新的名称来命名这一动画,因为Physically,既可以理解为物理反馈式的,也可以理解为人体的,因此更符合目前的研究方向和案例。
一、关于我的一点介绍
我是芬兰Aalto University计算机科学系的博士生。我目前的研究重点是为物理模拟角色在多智能体条件下的表现开发高效的,创造性的运动人工智能模拟技术。我的研究的最终目标是填补深度强化学习和在线最优化求解之间的空白。译注:多智能体(multi-agent),是多个Agent组成的集合,其多个Agent成员之间相互协调,相互服务,共同完成一个任务,鸟群、鱼群、兽群和菌落都可以被看成是多智能体系统。(http://t.cn/E2oDTFg)在线最优化求解:利用已有的样本数据训练的过程往往转换成一个最优化求解的过程。当我们面对高维高数据量的时候,批量处理的方式就显得笨重和不够高效,因此需要有在线处理的方法(Online)来解决相同的问题。(http://t.cn/E2oDuZf)累积奖励:强化学习作为一种机器学习方法,是通过Agent与环境交互和获得反馈来形成学习过程,当Agent做出了正确的步骤,积累奖励增加,错误则扣减。最著名的例子就是AlphaGo,以往的学习方法依赖大量的棋谱,而强化学习是通过对弈中的成败来形成奖惩来让机器变得更“聪明”。二、强化学习与PBA