观看记录
  • 我的观影记录
登录
什么是语音识别? (附图片)

什么是语音识别? (附图片)

语音识别或语音识别是一种利用音频输入而不是键盘输入数据的计算机技术。例如,对着麦克风说话会产生与使用键盘手动输入单词相同的结果。简而言之,语音识别软件是根据可识别单词或短语的内部数据库设计的。该程序将语音的音频签名与数据库中的相应条目进行匹配。

虽然将语音转换为文本听起来很容易,但这是一项极其困难的任务。问题在于几乎无限的个体语音模式和口音,再加上人类将单词连在一起的自然倾向,使情况更加复杂。

计算机的语音识别软件允许用户对着麦克风讲话以音频输入信息n 而不是打字。

各种型号的语音识别软件用于一系列应用,从个人听写到商业自动呼叫路由,从帮助残疾人到体育和新闻事件字幕。每个模型的行为都不同,并且有自己的功能和边界。

语音识别程序需要用户"训练"软件来识别其特定的风格化语音模式称为说话人相关系统。人们通常在家里或办公室使用这些类型的程序。电子邮件、备忘录、信件、数据和文本可以通过对着麦克风说话来输入。

一些语音识别系统,称为离散语音系统,要求用户清晰、缓慢地说话并分开单词。连续语音系统旨在理解更自然的说话模式。

智能手机配备了语音识别软件,可用于说出命令和说明。

离散语音系统广泛用于客户服务路由。该系统独立于说话者,但只能理解一小部分单词或短语. 呼叫者可以选择回答问题,通常选择"是"或"否"。收到答案后,系统将呼叫者升级到下一个级别。如果呼叫者回答了唯一的答案,则自动响应是通常,"抱歉,我没听懂你的意思;请重试",并重复问题和可用答案。这种类型的语音识别也称为语法约束识别。

连续语音是一种更复杂的语音识别软件形式,其中呼叫者可以自然地说出盟友解释问题或请求服务。该程序旨在挑选出关键词或短语,并对客户的需求进行统计最佳猜测。简单地说有助于程序确定需求。此类系统拥有比离散语音系统更为密集的数据库,也称为自然语言识别。

自动语音识别 (ASR) 是一种专为听写而设计的语音识别模型。该软件与以前的模型不同,它并不努力理解所说的内容,而只是识别所说的单词。由于英语中的许多单词发音相似,因此很容易出错。 ASR 软件通常用于数字录音机。

切换深色外观
留言
视频编辑修改
回到顶部
首页
手机数码
医疗健康
金融管理
社交情感
无名