本文要点
- 创建用户和机器人之间交互的思维导图。
- 构建交互工作流,使其更具对话性和个性化。
- 自然语言理解(NLU,Natural Language Understanding)支持用户以自然语言交流。
- 用户要传递信息,或是执行某个任务时,可能需要多轮交互。
- 只需构建和设计机器人一次,就可以将其部署到多个平台。
近些年,智能音箱和对话设备的应用日渐普及。当前,有超过6600万的美国成年人拥有智能音箱。也就是说,有近四分之一的美国人正在与设备对话。尽管此类智能设备已惠及芸芸众生,但其巨大潜力刚崭露头角。
Passage AI公司考量及此,推出了支持企业构建智能会话应用和技能的平台。
本文将提纲挈领地介绍实现对话AI的底层支撑技术。
为对话设备开发企业级技能,主要涉及三个层面:
- 交互流(Interaction Flow)。交互流定义并构建用户交互,以实现用户设定的目标,或是实现答疑解惑。
- 自然语言理解(NLU,Natural Language Understanding)。NLU支持机器人(bot)理解自然语言,并以自然语言作出响应。NLU包括意图分类、语义槽填充(slot filling)、语义搜索、自动问答、情感理解和响应生成等。
- 部署(Deployment)。一旦在接口中定义、构建并添加了NLU,就可将接口加入到各种会话渠道中,包括Google Home、Microsoft Cortana和Amazon Echo等对话设备,还包括Facebook Messenger、Android Business Messaging和Slack等消息应用,乃至集成在网站中的弹出式会话终端。
一、交互流
交互流是用户与机器人(即会话界面)间交互的思维导图。我们发现,预先设计交互流,非常有助于其实际构建。这需要我们在设计时做出更宽泛的考量,不仅考虑称为“基本逻辑”(happy path)的设定交互(也就是希望用户发起的交互),而且需补全基本逻辑之外的交互。下图给出一个示例交互流。其中,我们不仅设计了基本逻辑,还额外设计了更复杂的交互流。
图1:左图为基本逻辑流,右图给出了更复杂的交互流。
下面列出我们在设计对话交互流中获得的主要经验:
使交互流更具对话性和个性化。智能对话机器人不应像个机器人那样。在配置上,机器人应可从列表中随机选择会话,而非重复同样的消息。另一个做法是在对话界面中引入一些个性化。人们是与对话界面闲聊或交谈。因此在一开始不要只会说“嗨,我能为您提供什么帮助?”。而应使其更具个性,诸如“王先生,您好,周末快乐。今天我能为您做什么?”