我的机器人系列之(一):家庭服务机器人?

作者 shaw 日期 2016-11-09
我的机器人系列之(一):家庭服务机器人?

家庭服务机器人核心技术?

前言

最近有人老问我一个问题,说你们公司核心技术是什么?你们公司的核心是什么?这个问题估计很多创业公司都会被投资人问到,一般都会说我们技术怎么怎么牛,然后就开始吹牛!其实,仔细想想,对于一个公司来讲,什么是核心技术?凡是不能被轻易复制的东西就是核心技术。包括除了技术本身之外、团队、人脉、资源、市场、供应链、技术的保鲜期等等都可作为一个公司的核心。技术只是一个公司成长过程当中不断积累和探索的一个方面,会随着产品的迭代、公司的成长不断增强,过分的强调所谓的核心技术,可能未必是好事。商业的成功也许才是首要的。当然,作为一个搞技术的,深知研发投入将是公司保证产品质量、持续创新、保持增长的重要因素。既然谈到核心技术,今天主要谈谈家庭服务机器人当中的核心技术。在机器人这个领域也算是待了三四年,加上创业过程当中遇到的实际问题以及同行的交流,谈谈我们对家庭服务机器人的一些认识和思考。欢迎同行交流,我的邮箱是aiishaw@126.com.

家庭服务机器人核心技术

家庭服务机器人核心在于人机交互,现在说那么多识别、多那么多深度学习到底在解决什么问题。其实就是在解决三个层次的问题。

  • 第一,让机器人“耳聪目明”
  • 第二,实现人机“自然交互”
  • 第三,成为家庭“新的成员”

从方向上来看,基本上是感知到认知的过程。而目前整个学术界和产业界处在一个感知到认知的一个过度区域。就像扫地机器人一样,以前是“闭着眼睛”扫地,而现在加入了slam、运动规划,可以“睁着眼睛”扫地了,当然效率高很多。当然扫地机器人只是家庭服务机器人的一种,其实里面所包含的人工智能几乎为零。这里所指的家庭服务机器人只指具有视觉(眼睛)、耳朵(语音识别)、大脑(自然语言处理)的人工智能型机器人。(关于智能的深度理解,推荐这篇文章超智能体,可能需要翻墙)。当然由于用途不同,机器人又有各种分类,比如,儿童教育陪护机器人,老人看护机器人,家庭保姆机器人,聊天机器人等等。抛开功能及用途,一个真正的人工智能服务机器人必然是以交互为核心的,那么以交互为核心,可以将所有的技术、算法都统一起来。那么家庭服务机器人以交互为核心,主要有:视觉交互听觉交互运动交互内容交互这四类技术。

视觉交互

vision

听觉交互

vnlp

运动交互

movement

内容交互

content

有人认为,机器人=软件+硬件+算法+服务。只是从交互的另一面看问题,跟四大交互是统一的;另一方面,我们不断提高机器人的感知能力、运动能力、交互能力、认知能力也是这四大交互的另一种理解。

在这里,有必要提及几个比较重要和核心的东西。核心核心核心,重要的事情说三遍。

  • 第一,视觉技术的应用。由于计算资源的限制,如何能在家庭服务机器人当中应用深度学习的视觉技术将是一个重要的突破。关于机器人和深度视觉的问题可以看我的另外一篇博文
  • 第二,运动伺服控制。这一点对于机器人来说非常重要。为什么有的机器人特别笨,而有的机器人运动起来特别灵敏?为什么有的机器人可以走直线,行走、运动非常精准,而有的却不可以。能否拥有一套完善的机器人运动伺服系统将是制约机器人运动性能的关键因素。
  • 第三,避障系统。要想让机器人运动、行走,避障不能少。你可以不断的加超声,加红外,但是复杂场景完全解决不了。所以,此时必须加视觉进行避障。当然,一套完整的避障方案应当采用视觉+超声等传感器的方案。
  • 第三,SLAM。这个我就不多说了,未来vslam必然是趋势。

家庭服务机器人规划及思考

  • 不能产生内容的机器人不是一个好机器人
  • 不具有产生数据途径的公司不是一个真正的人工智能公司
  • 不能产生用户粘性的机器人只能是一个玩具
  • 家庭服务机器人同质化现象严重,机器人是一个本体,好的本体+好的服务才能进入家庭,满足用户的各个需求。

而我们在朝着这个目标去努力,比如我们的小武机器人.

end