留言 | 关于 | 联系
返回首页
当前位置: 首页 > 业界资讯 > W3C完成Web语音语音规格和语音识别语法规格

W3C完成Web语音语音规格和语音识别语法规格

时间:2004-03-26 20:50来源:日经BP社 作者:佚名 点击:
W3C公布了W3C推荐规格:基于XML的Web语音标签规格“VoiceXML 2.0”和语音识别语法描述语言“Speech Recognition Grammar Specification(SRGS)”。

【日经BP社报道】:
旨在推进Web相关技术标准化的W3C(万维网联盟),日前公布了W3C推荐规格:基于XML的Web语音标签规格“VoiceXML 2.0”和语音识别语法描述语言“Speech Recognition Grammar Specification(SRGS)”。这是W3C于美国当地时间3月16日宣布的。由此,构成W3C“Speech Interface Framework(语音接口框架)”的重要组件的规格制定工作全部完成。

VoiceXML 2.0的目的是高效的Web开发和向语音应用提供内容。SRGS的目的是,在具有语音接口的应用中,对有关用户对应用查询的语音应答的工具进行描述。

W3C主席提姆·博纳斯·李(Tim Berners-Lee)介绍说,“VoiceXML和SRGS标准制定工作的完成,可以说在电气通信技术和Web的集成中竖起了一个里程碑。从历史角度看,基于语音的系统发展方法和联网与Web的发展方法存在技术和文化上的阻隔。因此,过去只能靠语音或Web某一种方式获得信息”。“通过包括VoiceXML和SRGS在内的W3C语音接口框架的开发,将能够通过集中两大集团的优势,而得到相应的成果”(博纳斯·李)。

作为VoiceXML规格,在语音接口框架中规定了应用与用户之间的对话控制方法。定义了通过语音浏览器将内容传输给用户电话机等设备的配置和结构。能够生成可支持语音合成、语音数字化、语音识别、DTMF(按键式电话的语音信号)输入、录音、通话和说话人有变的会话等内容的语音对话框。

负责W3C语音浏览器事务的Dave Raggett介绍说,“作为VoiceXML 2.0,在语音服务中将不再需要‘某个情况请按1,否则请按2’等操作,可以通过会话进行选择和发送信息”。“而且,有眼疾的人以及因驾车而腾不出手和眼的人,均可进行Web访问”(Dave Raggett)。

作为SRGS,应用开发人员可以定义涵盖所有可能回答到的单词组合的工具。由此,就能实现不依赖说话人的识别功能。通过指定描述所设想的用户回答的语法,就能控制语音识别系统。SRGS支持语音输入和DTMF输入。另外,不仅是语音,还可应用于手写文字识别(尽管用户可输入的单词有限)。

W3C准备了可进行600多项试验的测试套件。

顶一下
(3)
75%
踩一下
(1)
25%
发表评论
评价:
验证码:点击我更换图片
推荐内容