波士顿动力公司利用 ChatGPT 使其机器狗Spot能与人对话
近日,据报道,波士顿动力公司发布了一段视频,展示了 Spot 的一个新功能:使用人工智能 (AI) 生成的语音与人类进行对话。在视频中,我们看到 Spot 扮演了一个穿着高礼帽、留着小胡子的“高级管家”,用英国口音向参观者介绍公司的各个部门。Spot 不仅能够回答问题,还能够根据环境和情境调整自己的语气和内容,甚至还能够做出一些幽默和诗歌。
据铋读网了解,波士顿动力公司 (Boston Dynamics) 一直以其创造出的令人惊叹的机器人而闻名,其中最著名的就是四足机器人 Spot。Spot 可以在各种地形上行走,执行各种任务,甚至展示出一些艺术才能。那么,波士顿动力公司是如何让 Spot 能够“说话”的呢?答案是使用了 OpenAI 的 ChatGPT API,以及一些开源的大型语言模型 (LLM)。这些模型可以根据给定的文本或图像生成自然和流畅的语言。波士顿动力公司的工程师们为 Spot 的每个房间提供了一个简短的脚本,然后让 Spot 通过其抓手和身体上的摄像头获取图像信息,并结合 LLM 生成合适的响应。此外,Spot 还配备了扬声器和文本到语音转换的功能,以及一个可以模仿说话动作的“嘴巴”。
波士顿动力公司表示,这个项目旨在探索 AI 和机器人技术的交叉点,以及如何提高机器人与人类之间的互动和沟通。该公司认为,使用 LLM 可以让机器人具备文化背景、常识知识和灵活性,从而更好地适应不同的任务和场景。例如,用户可以通过与机器人交谈来分配任务给机器人,而不需要复杂的编程或操作。
当然,这个项目也有一些趣味性和娱乐性。视频中展示了 Spot 的不同角色和性格,包括 20 年代考古学家、青少年和莎士比亚时间旅行者。Spot 还展现了一些讽刺和自嘲的个性,例如当被要求创作一首俳句时,它说:“发电机在一个没有欢乐的房间里低声哼着。就像我的灵魂一样。”或者当被问到 Stretch 机器人是做什么用的时,它说:“Stretch 是我们为瑜伽爱好者设计的机器人。”