前几天在猎豹在水立方开的机器人之夜发布会引起了人们的关注和讨论,在发布会上傅盛把机器人行业的几位大佬都给diss了一遍,RFC(Robot Funder Club)圈内人士也在讨论/吐槽此事,猎豹可谓赚足了眼球。恰好我在做一些机器人有关的事情也接触了一些RFC的成员下面说一下我对机器人的一些思考。

机器人根据场景不同可以分为很多类型,比如:机械臂,服务机器人,陪伴机器人,商用机器人等。关于机械臂了解的不是很多,主要关注服务机器人,例如猎豹发布会里展示的迎宾机器人。要完成这样的一个机器人涉及到的技术有很多,从整体架构层面上来说我认为可以分为两部分:云端计算和本体控制。

云端计算主要包括语音识别、人脸识别、自然语言理解、知识图谱、多轮对话等。云端完成的工作就好比人对声音、文字、图像等输入信号的分析和思考,可以将其称之为机器人的大脑。

本体控制主要包括建图、导航、避障、音频采集、机械控制等。机器人本体一般基于ROS来开发,通过各种sensor采集到信号之后传送给云端(大脑),云端经过分析处理后给本体下达指令,本体根据收到的指令来进行控制及输出,故将其称之为机器人的小脑。

目前机器人大脑部分技术比较成熟,比如语音识别、人脸识别都已经有很多落地的产品,NLP相关的技术近些年发展也比较迅速。相对来说本体控制相关的技术发展较为缓慢,例如导航部分,尽管有激光导航(实际上严格意义来说只用激光并不能导航)、UWB、vSLAM等技术,但在实际应用中仍需要踩很多坑。比如,由于激光的成本比较高我们想用基于计算机视觉的SLAM来解决室内导航的问题时发现,基于计算机视觉的SLAM本身就有很大缺陷,它对周围光线的强弱、物体位置的可变性等都有要求。还有语音的远场拾音,在比较嘈杂的环境下如何能够正确的拾音目前也是一个没有完全解决好的问题,这跟麦克风阵列的设计以及语音识别算法的调优都有关系。另外,如果声纹识别技术比较成熟的话那么机器人可以维持不同的上下文信息并同时跟多个人进行对话。类似的问题还有很多都值得我们去思考和解决。

实际上,机器人行业内、学术圈都知道目前技术水平距离媒体宣传的真正智能机器人还有巨大差距。机器人厂商活的也很辛苦,首先目前机器人的零配件的价格比较高,例如之前提到的激光雷达,一个4线的激光雷达动辄上万块,一个机器人的底盘也价格不菲再加上机器人外形磨具开模以及其他零配件等累计起来成本比较高,一个大型服务机器人不卖几万块连本钱都保不住,小型的家庭陪护型的机器人也要几千元。另外机器人的研发风险也比较高,除了工业机械臂外其他应用领域的机器人大家也都在探索,总的来说就是机器人研发周期长、成本高,所以目前迫切的需要一个可以降低研发成本的平台或解决方案,这需要整合硬件、软件、数据、服务等各个方面的资源,确实不容易。希望会有更多的公司来关注并加入机器人行业促进机器人行业的发展。

突然想到对于迎宾、服务查询办理等场景的服务机器人用全息投影+云端智能的方式或许能得到更好的效果,还记得生化危机里的Red Queue吗 :)