(资料图片)
韩国电子和电信研究所(ETRI)的研究人员最近开发了一种基于深度学习的模型,可以帮助机器人产生引人入胜的非语言社交行为,例如拥抱或握手。他们的模型在arXiv上预发表的一篇论文中提出,可以通过观察人类之间的互动,积极学习新的适合情境的社会行为。
“深度学习技术在计算机视觉和自然语言理解等领域产生了有趣的结果,”进行这项研究的研究人员之一Woo-RiKo告诉TechXplore。“我们着手将深度学习应用于社交机器人,特别是通过让机器人自己从人与人的互动中学习社交行为。我们的方法不需要人类行为模型的先验知识,而人类行为模型的实施通常既昂贵又耗时”
Ko及其同事开发的基于人工神经网络(ANN)的架构将谷歌研究人员在2014年推出的Seq2Seq(序列到序列)模型与生成对抗网络(GAN)相结合。新架构在AIR-Act2Act数据集上进行了训练,该数据集包含10种不同场景中发生的5,000次人机交互。
“拟议的神经网络架构由编码器、解码器和鉴别器组成,”Ko解释道。“编码器对当前用户行为进行编码,解码器根据当前用户和机器人行为生成下一个机器人行为,鉴别器防止解码器在生成长期行为时输出无效的姿势序列。”
AIR-Act2Act数据集中包含的5,000次交互用于提取超过110,000个训练样本(即短视频),其中人类在与他人互动时执行特定的非语言社交行为。研究人员专门训练他们的模型,为机器人生成五种非语言行为,即鞠躬、凝视、握手、拥抱和挡住自己的脸。
Ko和他的同事在一系列模拟中评估了他们的非语言社交行为生成模型,特别是将其应用于Pepper的模拟版本,Pepper是一种在研究环境中广泛使用的人形机器人。他们的初步发现很有希望,因为他们的模型在与人类的模拟交互过程中,在适当的时间成功地生成了五种行为。
“我们证明了可以使用深度学习方法教机器人不同类型的社交行为,”Ko说。“我们的模型还可以产生更自然的行为,而不是在现有的基于规则的方法中重复预定义的行为。随着机器人产生这些社交行为,用户会觉得他们的行为得到了理解和情感上的照顾。”
由这组研究人员创建的新模型可以帮助社交机器人更具适应性和社会响应能力,进而可以提高它们与人类用户互动的整体质量和流程。未来,它可以在广泛的机器人系统上实施和测试,包括家庭服务机器人、引导机器人、送货机器人、教育机器人和远程呈现机器人。
“我们现在打算进行进一步的实验,以测试机器人在部署在现实世界中并面对人类时表现出适当社交行为的能力;将测试所提议的行为生成器对机器人可能获得的嘈杂输入数据的稳健性”柯补充道。“此外,通过收集和学习更多交互数据,我们计划扩展机器人可以展示的社交行为和复杂动作的数量。”
更多信息:Woo-RiKo等人,使用端到端