可以理解人类语音的机器:人工智能的对话模式

2020-06-29 14:16:11    来源:新经网    作者:冯思韵

在人工智能发展的早期,研究人员意识到了能够理解人类语音的含义和细微差别的机器的功能和可能性。对话和人类语言是计算机特别具有挑战性的领域,因为单词和交流不精确。人类语言充满了细微差别,上下文,文化和社会深度以及不精确性,可能导致各种各样的解释。如果计算机可以理解我们谈话时的意思,然后以一种我们可以理解的方式与我们交流,那么很显然,我们已经实现了人工智能的目标。

对话互动是AI的一种模式

AI的会话模式

AI的这种特殊应用是如此深刻,以至于构成了AI的七个基本模式之一:对话和人类交互模式。对话模式的基本目标是使机器能够以人类自然语言模式与人类进行交流,并使机器能够以他们所理解的语言与人类进行交流。对话模式不要求人类遵循诸如打字,滑动,点击或使用计算机编程语言之类的交互机器模式,而是可以以彼此交互的方式与机器交互:以我们的大脑已经被理解的方式进行写作和交流。

当今AI狭义应用的许多情况都集中在人类交流上。如果计算机能够理解人类在交流时的含义,那么我们可以创建各种具有实用价值的应用程序,从聊天机器人和对话代理到可以读取我们在文档和电子邮件中写的内容的系统,甚至可以准确地翻译出一个人的系统。人类语言,而又不会失去意义和语境。

机器对人,机器对机器以及人对机器的交互都是AI如何交流和理解人类交流的例子。现实生活中的一些示例包括语音助手,内容生成,聊天机器人,情绪分析,情绪分析和意图分析,以及机器驱动的翻译。对话模式的应用是如此广泛,以至整个市场领域都专注于使用具有AI功能的对话系统,从对话金融到远程医疗等等。除了简单地理解书面或口头语言外,AI对话模式的力量还可以通过机器理解情感,情绪和意图的能力来体现,或者通过视觉手势将其转换为机器可理解的形式。

自然语言处理:在过去的几十年中不断发展

准确地处理和生成人类语言特别复杂,过去六十年来,技术不断发展。解决问题的一种方法是将音频波形转换为机器可读的文本,称为自动语音识别(ARS)。尽管ASR的实现有些复杂,但它通常不需要机器学习或AI功能,并且几十年来已经出现了一些相当准确的语音转文本技术。语音转文字不是自然语言的理解。当计算机记录人类在说什么时,它会获取它能理解的波形并将其转换为文字。它不会解释正在听到的数据。

文本转换为语音的逆向功能也不需要太多的机器学习或AI方式。文本到语音只是由计算机生成的波形,用以说出已知的单词。仅使用文本到语音时,对这些单词的含义没有任何了解。文字语音转换技术已经存在了很多年,您可以在电影《战争游戏》(1983年)中听到:“您想玩游戏吗?”

但是,即使机器学习已帮助文本转语音变得更人性化,并且语音转文本更准确,语音转文本和文本转语音也不是需要AI和机器学习的地方。自然语言处理(NLP)不仅涉及波形的转换和音频波形的生成。仅仅因为您有文字并不意味着机器可以理解它。为了获得这种理解,机器需要能够理解和生成词性,提取和理解实体,确定单词的含义以及使用更为复杂的处理活动将概念,短语,概念和语法连接在一起,从而形成更大的画面。意图和意义。

自然语言处理包括两个部分:自然语言理解和自然语言生成。自然语言理解是指计算机解释诸如语音或文本之类的人类输入并将其转换为机器能够以预期方式使用的东西。自然语言理解由许多子域组成,这些子域试图从音频波形生成的文本或人类在文本模式交互(例如聊天机器人或消息传递界面)中键入的文本中理解意图。AI应用于词法分析,以理解语法规则并将句子分解为结构性成分。不管使用哪种方法,大多数自然语言理解系统都共享一些公共组件。然后,一旦确定了组件,每件作品都可以在语义上理解为基于上下文和单词顺序来解释单词。进一步的逻辑分析和推论可用于使用知识图和其他推论含义的方法,基于各个部分所指的内容来确定含义。

自然语言的生成是AI能够以任何自然的方式听起来不像是计算机制作的形式为人类准备交流的过程。为了使计算机过程被视为自然语言的生成,计算机实际上必须解释内容并理解其内容以进行有效的交流。这涉及自然语言理解中确定的许多步骤的逆转,这些概念采用概念并通过机器如何理解人类的交流方式来产生人类可理解的对话。

为什么机器便利的对话如此重要?

归结为人与计算机通信的模式时,它受到了极大的关注,因为有时我们与系统的交互可能非常困难。键入或滑动可能会花费一些时间,并且无法正确传达我们的需求,而阅读诸如FAQ之类的静态内容可能对大多数客户没有帮助。人们希望与机器进行高效交互。许多用户界面对于人机交互而言并不是最理想的,需要混乱的菜单交互,过于简单的交互式语音响应系统或无法满足用户需求的基于规则的聊天机器人。

更加智能的对话系统的开发可以追溯到几十年前,而ELIZA聊天机器人最早于1966年开发,说明了机器介导的对话的可能性。如今,用户更加熟悉语音助手,例如Alexa,Google Assistant,Apple Siri,Microsoft Cortana和基于Web的聊天机器人。但是,如果您最近与他们中的任何一个进行过互动,那么他们仍然缺乏许多重要方式的理解。毫无疑问,人工智能研究人员的许多工作将致力于改善机器能够理解和生成人类语言的方式,从而增强那些利用人工智能对话模式的应用程序的功能。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。