首页编程正文内容

Speech SDK使用说明

编程

更新时间：2025-05-02 04:19:25 23

admin 管理员组

文章数量: 1086019

2024年3月22日发(作者：for语句流程图画法)

微软Windows Speech SDK编程入门

2009-02-24 13:33

一、SAPI简介

软件中的语音技术包括两方面的内容，一个是语音识别(speech recognition) 和语音合成(speech

synthesis)。这两个技术都需要语音引擎的支持。微软推出的应用编程接口API，虽然现在不是业界

标准，但是应用比较广泛。

SAPI全称 The Microsoft Speech API.相关的SR和SS引擎位于Speech SDK开发包中。这个语音引

擎支持多种语言的识别和朗读，包括英文、中文、日文等。

SAPI包括以下组件对象（接口）：

（1）Voice Commands API。对应用程序进行控制，一般用于语音识别系统中。识别某个命令后，会

调用相关接口是应用程序完成对应的功能。如果程序想实现语音控制，必须使用此组对象。

（2）Voice Dictation API。听写输入，即语音识别接口。

（3）Voice Text API。完成从文字到语音的转换，即语音合成。

（4）Voice Telephone API。语音识别和语音合成综合运用到电话系统之上，利用此接口可以建立一

个电话应答系统，甚至可以通过电话控制计算机。

（5）Audio Objects API。封装了计算机发音系统。

SAPI是架构在COM基础上的，微软还提供了ActiveX控件，所以不仅可用于一般的windows程序，

还可以用于网页、VBA甚至EXCEL的图表中。如果对COM感到陌生，还可以使用微软的C++ WRAPPERS，

它用C++类封装了语音SDK COM对象。

二、安装SAPI SDK。

首先从这个站点下载开发包：/speech/download/sdk51

Microsoft Speech SDK 5.1添加了Automation支持。所以可以在VB,ECMAScript等支持Automation

的语言中使用。

版本说明：

Version: 5.1

发布日期: 8/8/2001

语音: English

下载尺寸: 2.0 MB - 288.8 MB

这个SDK开发包还包括了可以随便发布的英文和中文的语音合成引擎(TTS)，和英文、中文、日文的

语音识别引擎(SR)。

系统要求98以上版本。编译开发包中的例子程序需要vc6以上环境。

******下载说明******：

（1）如果要下载例子程序，说明文档，SAPI以及用于开发的美国英语语音引擎，需要下载

，大约68M。

（2）如果想要使用简体中文和日文的语音引擎，需要下载。大约82M。

（3）如果想要和自己的软件一起发布语音引擎，需要下载，大约132M。

（在这个地址，我未能成功下载）。

（4）如果要获取XP下的 Mike 和 Mary 语音，下载。大约3.5M。

（5）如果要获取开发包的文档说明，请下载。大约2.3M。这个在sdk51里面已经包含。

下载完毕后，首先安装，然后安装中文语言补丁包SpeechSDK51LangPack，然后展

开

msttss22l，自动将所需dll安装到系统目录。

三、配置vc环境

在vc6.0的环境下编译语音工程，首先要配置编译环境。假设sdk安装在d:Microsoft Speech SDK

5.1路径下，打开工程设置对话框，在c/c++栏中选择Preprocessor分类，然后在"附加包含路径"

中输入

d:Microsoft Speech SDK 5.1include

告诉vc编译程序所需的SAPI头文件的位置。

然后切换到LINK栏，在Input分类下的附加库路径中输入：

d:Microsoft Speech SDK 5.1libi386

使vc在链接的时候能够找到。

四、语音合成的应用。即使用SAPI实现TTS(Text to Speech)。

1、首先要初始化语音接口，一般有两种方式：

ISpVoice* pVoice;

::CoInitialize(NULL);

HRESULT hr = CoCreateInstance(CLSID_SpVoice, NULL, CLSCTX_ALL, IID_ISpVoice,

(void **)&pVoice);

然后就可以使用这个指针调用SAPI函数了，例如

pVoice->SetVolume(50);//设置音量

pVoice->Speak(ysString(),SPF_ASYNC,NULL);

另外也可以使用如下方式：

CComPtr m_cpVoice;

HRESULT hr = m_teInstance( CLSID_SpVoice );

在下面的例子中都用这个m_cpVoice变量。

CLSID_SpVoice的定义位于SPAI.H中。

2、获取/设置输出频率。

SAPI朗读文字的时候，可以采用多种频率方式输出声音，比如：

8kHz 8Bit Mono、8kHz 8Bit Stereo、44kHz 16Bit Mono、44kHz 16Bit Stereo等。在音调上有

所差别。具体可以参考sapi.h。

可以使用如下代码获取当前的配置：

CComPtr cpStream;

HRESULT hrOutputStream = m_cpVoice->GetOutputStream(&cpStream);

if (hrOutputStream == S_OK)

{

本文标签：语音下载引擎使用接口

版权声明：本文标题：Speech SDK使用说明内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1711105490a588740.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

程序语言设计基础

技术日记

3月前

年月日发(作者：舞钢二郎山风景名胜区介绍)程序语言设计基础程序语言设计基础是指能够理解和运用各种程序语言的基本知识和技能。它包括以下方面：.编程语言的基本概念：理解什么是编程语言、编程语言的组成部分、编程语言的分类等。.编程语言的语法：掌握

计算机系统中程序设计语言的层次体系

技术日记

3月前

年月日发(作者：百度菜鸟教程)二、程序设计语言旳层次体系为阐明了程序设计语言旳层次体系。图中将程序设计语言分为低档语言和高档语言两类。“级”是指程序员与计算机对话旳复杂限度。例如，就查询语言来说，程序员(常常是顾客管理人员)只需要波及到计算

《C++ 程序设计语言》课程教学大纲

技术日记

3月前

年月日发(作者：建筑工程个人简历模板下载)《程序设计语言》课程教学大纲一、课程名称：程序设计语言二、学分：三、先修课程：《程序设计语言》或者其他任何一门结构化程序设计语言。四、课程的性质、目的和任务：《程序设计语言》课程是网络教育考试“计算

《C语言程序设计》谭浩强版-教学教案k

技术日记

3月前

年月日发(作者：)《语言程序设计》谭浩强版-教学教案章节一：语言简介教学目标：.了解语言的历史和发展.掌握语言的特点和优势.理解语言在计算机科学中的应用教学内容：.语言的历史和发展.语言的特点和优势.语言的应用领域教学方法：.讲解法：讲解语

windows XP中添加loopback接口(虚拟网卡)，设置虚拟网卡物理地址

编程

3月前

为了做实验方便，windows中经常要添加一个永远活动的loopback接口，下面是添加loopback接口的方法： 开始》控制面板》添加硬件，双击&a

固态硬盘接口 macbook_固态硬盘的各种接口

编程

3月前

★引言不同规格的硬盘上会使用不一样的接口如上图所示，视固态硬盘大小不同，其接口也是多种多样的，简直让人眼花缭乱。较常见的固态硬盘接口较常见的固态硬盘接口是SATA、SATAe、U.2、mSATA、M.2、PCIe和SAS，除了以上的

win8连接wifi成功但受限制_必看丨“格力+”手机APP，智能WiFi连接教程。（含AI语音连接教程）...

编程

3月前

早上出门忘关空调回家就想感受惬意凉爽格力智能WIFI空调内置WIFI智能模块只需安装格力APP 即可轻松实现远程操作人在远方，家在身边。 “格力”APP连接教程指引(视频) 准备工作下载软件 ☟ 如何下载

华为eNSP:路由器子接口配置

编程

3月前

一、拓扑图二、路由器配置 [R1]int g000.1#进入子接口[R1-GigabitEthernet000.1]ip add 192.168.1.254 24#配置子接口地址[R1-GigabitEthernet00

喜讯 | 标贝科技入选腾讯AI加速器三期，加速AI语音场景落地产业

编程

3月前

2019年8月16日，腾讯产业加速器系列的AI加速器三期名单正式公布。标贝科技作为一家领先的人工智能语音合成及数据服务方案提供商企业，从1500名竞争者中脱颖而出，将参与到腾

第三方登录 QQ登录（一）申请接口

编程

3月前

申请QQ的第三方登录接口，你必须有一个在国内备案过的网站，个人的网站也可以。 1、成为开发者进入QQ互联的官网：https:connect.qq&#xff0

大数据十大开源查询引擎

编程

3月前

1.Hive Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能，可以将SQL语句转换为Map-Reduce

世界十大游戏引擎

编程

3月前

第10位：The Dead engine，死亡引擎，美国EA公司重制过的引擎，代表作是《死亡空间》系列。第9位：Mt Frame

7个最优秀的手机游戏引擎

编程

3月前

随着智能手机成为主要的游戏平台，移动游戏引擎变得越来越流行。下面将介绍7个最优秀的手机游戏引擎。 1.Corona SDK 游戏开发引擎这是一款实用Lua语言作为开发语言的游戏引擎，对我来

6年前布局，如今阿里智能语音成行业第一，我们的快递、客服都离不开它

编程

3月前

简介：2014年，阿里巴巴悄悄启动了智能语音项目，6年过去了，它长大成了国内第一。国际权威调研机构IDC公布《中国AI云服务市场半年度研究报告》&

第21节 ACL——控制路由器上接口大门的进出规则

编程

3月前

这里写目录标题 1 ACL概述2 ACL分类及原理2.1 标准ACL2.2 扩展ACL2.3 原理 3 ACL编辑4 命名ACL5 总结6 参考文献 1 ACL概述定义：Access Control List 访问

如何配置路由器接口IP，手把手教你配置DHCP

编程

3月前

目录配置命令 DHCP：动态主机配置协议路由器网线： RJ-45双绞线（家用最常用） 非屏蔽线最佳距离100m；民用

某磁某力某酷搜索接口

编程

2月前

import requestscookies = {'Hm_lvt_0cfd3331418a7549c90c525782ad82ee': '1707651377','dom3ic8zudi2

某黑马magnet搜索接口

编程

2月前

import requestscookies = {'JSESSIONID': 'ACC5D9245FC54596A57C4486CF2C0EA9','HstCfa4602665'

引擎

编程

2月前

对游戏编程初哥来说，选择一个好的游戏引擎是一个很头疼的事。市面上鱼目混杂，并且价格不菲。今天我要隆重推出开源游戏引擎五强（严格上说是四个，有一个是图像引

Is ChatGPT A Good Translator? Yes With GPT-4 As The Engine——ChatGPT 是一个好的翻译器吗？是的，以 GPT-4 为引擎

编程

1月前

这篇文章主要探讨了ChatGPT在机器翻译任务中的表现，并对其进行了初步评估。以下是文章的主要内容总结： 研究背景：ChatGPT是基于GPT-3.5和GPT-4的智能聊天机

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

Speech SDK使用说明

更多相关文章

程序语言设计基础

计算机系统中程序设计语言的层次体系

《C++ 程序设计语言》课程教学大纲

《C语言程序设计》谭浩强版-教学教案k

windows XP中添加loopback接口(虚拟网卡)，设置虚拟网卡物理地址

固态硬盘接口 macbook_固态硬盘的各种接口

win8连接wifi成功但受限制_必看丨“格力+”手机APP，智能WiFi连接教程。（含AI语音连接教程）...

华为eNSP:路由器子接口配置

喜讯 | 标贝科技入选腾讯AI加速器三期，加速AI语音场景落地产业

第三方登录 QQ登录（一） 申请接口

大数据十大开源查询引擎

世界十大游戏引擎

7个最优秀的手机游戏引擎

6年前布局，如今阿里智能语音成行业第一，我们的快递、客服都离不开它

第21节 ACL——控制路由器上接口大门的进出规则

如何配置路由器接口IP，手把手教你配置DHCP

某磁某力某酷搜索接口

某黑马magnet搜索接口

引擎

Is ChatGPT A Good Translator? Yes With GPT-4 As The Engine——ChatGPT 是一个好的翻译器吗？是的，以 GPT-4 为引擎

发表评论

推荐文章

javascript - Colorbox Remove Frame Arrow Navigation - Stack Overflow

javascript - Posting messages from a service worker to a client page - Stack Overflow

python - Custom sorting a single string - Stack Overflow

javascript - gtag is not sending custom event when redirecting to external page - Stack Overflow

How to Connect Two ThingsBoard Edges to Different Databases with the Same User and Sync Data to ThingsBoard Core? - Stack Overfl

热门文章

html - Make text wrap around image - Stack Overflow

authentication - NextAuth.js session.expires not updating correctly from JWT exp - Stack Overflow

javascript - Performance slow with kineticjs - Stack Overflow

javascript - How can I start a function in a new tab using a bookmarklet? - Stack Overflow

ASUS华硕原厂系统Win11.22H2 新版TLK工厂模式安装教程说明

javascript - Sort and filter columns with XLSX js after json_to_sheet - Stack Overflow

unity game engine - IpointerClickHandler not working without IPointerDownHandler on UI - Stack Overflow

swift - NavigationLink in swiftui and routing - Stack Overflow

javascript - How to show specific content based on 3 drop down selections? - Stack Overflow

amazon ec2 - Expo dev build on mobile phone won&#39;t connect to server on AWS EC2 - Stack Overflow

最新文章

javascript - How do I toggle the readonly attribute of all child element with jquery - Stack Overflow

javascript - Might it be possible to block an entire US state from accessing my site, using PHP? - Stack Overflow

c++ - Is dereferencing std::span::end always undefined? - Stack Overflow

javascript - Delay function execution if it has been called recently - Stack Overflow

javascript - Google Maps Autocomplete List - Stack Overflow

windows设置断电重启开机后自动输入锁屏密码登录

Windows系统设置开机默认开启数字小键盘

Windows11 开机自动同步时间（开机时间不更新问题）

windows配置开机自启动软件或脚本

【Redis】Windows设置Redis为开机自启动

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

第三方登录 QQ登录（一）申请接口

amazon ec2 - Expo dev build on mobile phone won't connect to server on AWS EC2 - Stack Overflow