觉得智能助理还是微软的小娜、百度的小智?不好意思,这里有个智能机器人可能要抢在前头把这些活儿全包了。

上面说到的这个机器人叫Rokid(若琪),是杭州芋头科技的第一个产品。目前,Rokid还未公开发布,这次是一个小型的“见面会”。在芋头科技一群家长的眼中,它的语料库还有非常多地方亟待完善。

即便如此,摆在我们眼前的Rokid已能完成很多日常对话了,包括回答时间、放音乐、查天气、控制扫地机、冷不丁冒出幽默的回答等等。

在它开始工作之前,你要先呼唤一声“嘿,若琪”(对,这是它的中文名。现场有人喊了声“白若琪”,它居然也能感应),或者对着它的“眼睛”——摄像头招一招手。Rokid给你的反应是回答“嘿”或者“眨眼”(界面中间出现大大的圆圈),底盘的亮光告诉你它正面对着你。接下来,你就可以吩咐它做事儿了。

现场有人说了一句“若琪,放一首女歌手的歌吧!”第一遍它没有听清楚,第二遍就搜到了一首韩国女星的歌,放了起来。放音乐的时候会自带封面,过几秒钟变换成柔光屏保的样子。

一首歌还没放完,就有另一个小伙伴匆匆打断:“嘿,若琪,杭州的天气怎么样?”它马上停下了音乐,搜索到“杭州今天的天气晴朗,气温21摄氏度……”你也可以问它明天、大后天天气怎么样。你还可以说“把窗帘拉开”或者“扫个地”,它会默默执行正确的任务。

如果你挥一挥手或者告诉它“没事儿了”,Rokid就会切回星空屏保的休眠状态。

目测,Rokid对人声的平均反应时间在5秒之内(网速慢的除外),可以看段视频感受一下:

得承认,一开始外貌协会的我觉得Rokid长相不出彩。但接触了一会儿后,我感觉这家伙看着蛮舒服,还有点酷。

另外有意思的是,Rokid还真挺拟人。拟人的表现主要是它的深度学习体系,一句话概括就是“随着和你相处的时间越久,它越熟悉你的习性”。是不是挺像个一直陪伴你的朋友?

不过,刚开始的Rokid相当于一张白纸,它的智力处于幼儿水平,会像孩子那样学习,包括图像识别和语义识别两大方面:

图像识别开始于存储到你的正面和侧面影像后。Rokid的摄像头不是通过不断存储你的影像图片,叠加后精确你的面孔来识别“你”,而是通过捕捉你的“视频流”(不存储)来不断“加深”自己对你的印象,越来越熟悉这“人”是“你”

语义识别则和微软小娜的原理相似,在Rokid的后台有不同类别的语料库,装着不同的对话策略,如果你说的内容在语料库中它会立马回答,如果不在它就会说“不知道”。此外,如果它频繁遇到不同用户提交的策略外问题,工程师就会在之中加入新的对话脚本。也许第一次它说“不知道”,第二次就能回答出正常的答案了。

Rokid还兼具声纹识别功能,据说和它“混熟”的工程师在楼下喊“若琪”,它都能从休眠中醒来。

想象一下未来,如果Rokid能够在我不开心的时候“认”出我的沮丧放我最喜欢的歌来安慰我,那是温暖贴心,又有点儿酷呢。

 


拓展阅读我调戏了小冰一年,最后发现她还不是一个能够帮助我生活的人