您好,欢迎进入x幸运赛车有限公司官网!

栏目导航
联系我们
服务热线
029-68973358
丰富的工程案例,
众多的合作客户,
精良的仪器设备,
细致的周到服务,
欢迎朋友们光临惠顾!
地址: 西安市碑林区长胜街58号
当前位置:主页 > 幸运赛车计划 > 公司动态 >
极速赛车让开发者自定义热词检测轻松唤醒对话机器人
作者:幸运赛车 发布日期:2018-02-18

  KITT.AI与很多做chatbot的初创公司不一样的地方是,KITT.AI同时拥有制作对话机器人所需要的其他技术:用来做热词检测的Snowboy,以及用来做自然语言理解的NLU技术。

  Snowboy着重解决的是“热词检测”这个小而复杂的问题,并提供给开发者一套工具让他们自定义热词。

  “热词”又叫“唤醒词”,是一个用来唤醒的单词,比如常用的“Alexa”和“OK Google”。其难点是算法必须在设备终端运行,不能切入云平台。因为一个7×24小时监听的设备要保护用户隐私,只能做本地处理,而不能将音频流联网进行云端处理。

  热词检测常常位于基于语音的聊天机器人的最前端,只有机器检测到唤醒词后,才会开始执行人类指令。热词检测的主创者陈果果向密探解释了设计的挑战难度,“热词检测既要做到准确无误,又要保证不误触发。我们写了自己的深度学习运行库,并把它压缩到不超过2MB的嵌入式设备上运行,同时还需要保证留给终端设备足够的CPU资源去运行其他的任务。”

  热词检测有一个长久以来的用户痛点:用户想自由自在地用任何词唤醒他们的对话机器人。然而,在Snowboy之前,这个问题一直没有很好的解决方案。有的用户会简单制作一个击掌检测器(clap detector),就像很多中国居民楼道里用的声控电灯一样;亚马逊在他们的第一版树莓派上运行的Alexa设备上则强制用户用一个按钮去“按醒”机器人。

  Snowboy出现后,立马受到开发者的欢迎。发布半年后,已经有超过5000名开发者使用Snowboy,用15种语言自定义了3000多个热词。Snowboy的GitHub代码每天都有超过100个独特用户克隆使用。

  NLU着重解决的问题是单句的语义理解。比如,当用户说“给我讲个关于码农的笑话吧”,NLU能理解用户的意图是听笑话,主题是码农。但是大部分的日常对话不是一句话就能解决的,大都需要多轮问询并确认才可以。ChatFlow内置的对话管理器能够极好地追踪上下文。

  “结合ChatFlow和NLU,开发者可以建立基于文本的自然语言多轮对话系统,再结合Snowboy以及相应的语音识别API,开发者就可以实现基于语音的自然语言多轮对话系统。”KITT.AI的联合创始人陈果果解释道。

  很多大公司和高科技创业公司都有自己做chatbot的一套做法,但这只能让公司内部的人熟练使用。让更多的开发者即使不是AI专家也能制作聊天机器人,将整套方法大众化是KITT.AI和ChatFlow致力于解决的问题。开发者能够在KITT.AI网站上找到详尽的文字说明和YouTube视频教程。

  2015年,陈果果和Kenji Sagae作为联合创始人加入团队。博士毕业于约翰霍普金斯大学的陈果果,曾在Google实习两次,也曾参与了微软深度学习框架CNTK的开发。他参与制作的“OK Google”热词检测雏形,如今用在了超过一亿台安卓和Google Home设备上。他还与同学在美国高级情报研究计划署的混响空间语音识别比赛中拿到第一名。

  团队的顾问Kenji Sagae曾是美国南加州大学教授,极速赛车研究自然语言解析和对话系统,并教授了“人工智能”和“自然语言处理”这两门课。他也是姚旭晨2009年在美国实习时候的导师。

  2016年,团队请来了在谷歌做Neural Machine Translation的TensorFlow专家曹原,以加强公司在NLU方面的实力。曹原是姚旭晨和陈果果读博时候的同学,博士毕业时,有多篇机器学习方面的论文,学术成果显著。

  KITT.AI作为一个SaaS(Software as a service)平台,商业模式是客户买license,授权使用,然后收取单笔费用。这种模式在人工智能领域有不少先例,比如最近阿里云人工智能ET入职饿了么担任调度员,实现智能派单并确保效率最优,这是继交通、空管、货运之后,ET的第四份调度员工作,背后都是利用这种license授权服务。