《语音处理及人机交互技术/智能科学技术著作丛书》科学出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

《智能科学技术著作丛书》序

前言

第1章绪论

1.1 语音信号技术的历史

1.2 语音信号技术应用及新方向

1.2.1 语音信号的识别

1.2.2 语音信号的合成

1.2.3 语音信号的编码

参考文献

第2章语音信号的声学基础

2.1 语音信号的产生

2.1.1 语音发音器官

2.1.2 语音声学特征

2.1.3 语音信号的时域及频域表示

2.1.4 汉语语音分类

2.1.5 汉语语音韵律特性

2.2 语音信号的感知

2.2.1 人的听觉系统

2.2.2 人耳的听觉特性

2.2.3 人耳听觉的掩蔽效应

2.3 语音信号生成的数学模型

2.3.1 激励模型

2.3.2 声道模型

2.3.3 辐射模型

2.3.4 语音信号的数学模型

2.4 语音产生的非线性模型

2.4.1 调频一调幅模型的基本原理

2.4.2 Teager能量算子

2.4.3 能量分离算法

2.4.4 调频一调幅模型的应用

参考文献

第3章语音信号的分析

3.1 语音信号预处理步骤

3.1.1 采样与量化

3.1.2 预加重

3.1.3 分帧与加窗

3.1.4 端点检测

3.2 语音信号的时域分析

3.2.1 短时能量分析

3.2.2 短时平均过零率

3.2.3 短时自相关函数和短时平均幅度差函数

3.3 语音信号的频域分析

3.3.1 滤波器组方法

3.3.2 傅里叶频谱分析

3.3.3 线性预测倒谱系数

3.3.4 Mel频率倒谱系数

3.4 语音信号的倒谱分析

3.4.1 同态信号处理的基本原理

3.4.2 复倒谱和倒谱

3.5 语音信号的小波分析

参考文献

第4章语音增强

4.1 语音信号与语音增强

4.1.1 语音特性

4.1.2 人耳感知特性

4.1.3 噪声特性

4.1.4 语音增强的信号模型

4.2 谱减法语音增强

4.2.1 基本原理

4.2.2 基本谱减法的改进

4.3 维纳滤波法语音增强

4.4 卡尔曼滤波法语音增强

4.5 最小均方误差法的语音增强

4.6 语音增强的一些新发展

参考文献

第5章模式识别算法及应用

5.1 矢量量化的基本原理

5.2 矢量量化的失真测度

5.2.1 欧氏距离测度

5.2.2 线性预测失真测度

5.2.3 识别失真测度

5.3 人工神经网络的基本原理

5.4 人工神经网络的基本构成

5.4.1 人工神经元模型

5.4.2 神经网络有向图表示

5.4.3 神经网络结构及工作方式

5.5 基本神经网络模型及算法

5.5.1 单层感知器

5.5.2 多层感知器

5.5.3 径向基函数神经网络模型

5.5.4 循环神经网络

5.5.5 支持向量机

参考文献

第6章语音信号的识别

6.1 语音识别概述

6.2 孤立词语音识别

6.3 连续词语音识别

6.4 说话人识别

6.4.1 说话人识别概述

6.4.2 说话人识别特征选取

6.4.3 说话人识别系统的结构

6.4.4 说话人识别中的识别方法

6.4.5 说话人识别中需进一步研究的问题

6.5 语音信号预处理

6.6 语音信号识别特征提取

6.7 语音信号识别方法

6.8 隐马尔可夫模型基本原理及在语音识别中的应用

6.8.1 马尔可夫链

6.8.2 隐马尔可夫模型的定义

6.8.3 隐马尔可夫模型的三个问题

6.8.4 隐马尔可夫模型在语音识别中的应用

6.9 动态时间规整算法

参考文献

第7章语音信号的合成

7.1 概述

7.2 语音合成的基本方法

7.2.1 以单词为基础的合成方法

7.2.2 以音节为基础的合成方法

7.2.3 以音素为基础的合成方法

7.3 共振峰合成法

7.4 线性预测合成法

7.5 语音合成专用硬件介绍

7.6 PSOLA算法合成语音

7.7 文语转换系统

参考文献

第8章语音信号定位与分离技术

8.1 声源定位技术

8.1.1 基于麦克风阵列的定位方法

8.1.2 基于人耳听觉机理的声源定位

8.2 语音分离技术

8.2.1 计算听觉场景分析

8.2.2 计算听觉场景分析的语音分离模型

8.2.3 独立分量分析

8.3 声源定位与语音分离实现方法

参考文献

第9章基于听觉机制的语音识别

9.1 人耳的听觉机制

9.1.1 人耳听觉中枢的物理结构

9.1.2 人耳听觉中枢的听觉机理

9.2 人耳听觉系统的基本模型

9.2.1 人耳听觉系统的外周听觉模型

9.2.2 人耳听觉系统的内毛细胞模型

9.2.3 人耳听觉系统的重合神经元模型

9.3 多声源环境下人耳语音定位模型

9.3.1 双耳线索

9.3.2 耳廓效应

9.3.3 双耳时间差模型

9.3.4 多声源环境下声源定位系统的设计

9.4 多声源环境下人耳语音分离模型

9.4.1 语音信号分离的反演模型

9.4.2 语音信号分离系统的设计

9.5 基于听觉机制的语音识别系统

参考文献

第10章基于语音的人机交互及应用

10.1 人机交互的研究及发展

10.1.1 人机交互概述

10.1.2 人机交互的研究内容

10.1.3 人机交互的发展历程

10.2 语音人机交互及其应用

10.2.1 语音人机交互概述

10.2.2 语音人机交互与智能轮椅

10.2.3 语音人机交互与智能电视

10.2.4 语音人机交互的其他应用

参考文献

图书	语音处理及人机交互技术/智能科学技术著作丛书
内容	编辑推荐《语音处理及人机交互技术/智能科学技术著作丛书》是在作者张毅、刘想德、罗元多年从事服务机器人及信息无障碍技术的基础上总结所取得的研究成果，并结合当前国际国内服务机器人方面的最新进展撰写完成的，以助老助残为目标，从老年人和残障人生理需求和心理需求出发，以服务机器人和信息无障碍技术为对象，系统地阐述了服务机器人与信息无障碍技术的基本原理与关键技术，并给出了服务机器人和信息无障碍服务系统的应用示例。内容推荐在总结目前国内语音处理和人机交互研究现状的基础上，张毅、刘想德、罗元编著的《语音处理及人机交互技术/智能科学技术著作丛书》着重介绍作者在语音信号处理、语音特征提取、模式识别及人机交互应用等方面取得的研究成果。内容主要包括语音信号的声学基础、语音信号的分析、语音增强、模式识别算法及应用、语音信号的识别、语音信号的合成、语音信号定位与分离技术的理论与方法等。本书内容全面，重点突出，对原理的阐述清晰易懂，可读性强。本书可作为智能科学与技术、控制科学与工程、计算机科学与技术、机械电子工程、通信工程、生物信息技术、光电工程等与语音处理及其人机交互有关学科及专业的本科生和研究生的教材或参考书，也可供从事语音信号处理、语音人机交互、智能机器人等方向的技术人员参考。目录《智能科学技术著作丛书》序前言第1章绪论 1.1 语音信号技术的历史 1.2 语音信号技术应用及新方向 1.2.1 语音信号的识别 1.2.2 语音信号的合成 1.2.3 语音信号的编码参考文献第2章语音信号的声学基础 2.1 语音信号的产生 2.1.1 语音发音器官 2.1.2 语音声学特征 2.1.3 语音信号的时域及频域表示 2.1.4 汉语语音分类 2.1.5 汉语语音韵律特性 2.2 语音信号的感知 2.2.1 人的听觉系统 2.2.2 人耳的听觉特性 2.2.3 人耳听觉的掩蔽效应 2.3 语音信号生成的数学模型 2.3.1 激励模型 2.3.2 声道模型 2.3.3 辐射模型 2.3.4 语音信号的数学模型 2.4 语音产生的非线性模型 2.4.1 调频一调幅模型的基本原理 2.4.2 Teager能量算子 2.4.3 能量分离算法 2.4.4 调频一调幅模型的应用参考文献第3章语音信号的分析 3.1 语音信号预处理步骤 3.1.1 采样与量化 3.1.2 预加重 3.1.3 分帧与加窗 3.1.4 端点检测 3.2 语音信号的时域分析 3.2.1 短时能量分析 3.2.2 短时平均过零率 3.2.3 短时自相关函数和短时平均幅度差函数 3.3 语音信号的频域分析 3.3.1 滤波器组方法 3.3.2 傅里叶频谱分析 3.3.3 线性预测倒谱系数 3.3.4 Mel频率倒谱系数 3.4 语音信号的倒谱分析 3.4.1 同态信号处理的基本原理 3.4.2 复倒谱和倒谱 3.5 语音信号的小波分析参考文献第4章语音增强 4.1 语音信号与语音增强 4.1.1 语音特性 4.1.2 人耳感知特性 4.1.3 噪声特性 4.1.4 语音增强的信号模型 4.2 谱减法语音增强 4.2.1 基本原理 4.2.2 基本谱减法的改进 4.3 维纳滤波法语音增强 4.4 卡尔曼滤波法语音增强 4.5 最小均方误差法的语音增强 4.6 语音增强的一些新发展参考文献第5章模式识别算法及应用 5.1 矢量量化的基本原理 5.2 矢量量化的失真测度 5.2.1 欧氏距离测度 5.2.2 线性预测失真测度 5.2.3 识别失真测度 5.3 人工神经网络的基本原理 5.4 人工神经网络的基本构成 5.4.1 人工神经元模型 5.4.2 神经网络有向图表示 5.4.3 神经网络结构及工作方式 5.5 基本神经网络模型及算法 5.5.1 单层感知器 5.5.2 多层感知器 5.5.3 径向基函数神经网络模型 5.5.4 循环神经网络 5.5.5 支持向量机参考文献第6章语音信号的识别 6.1 语音识别概述 6.2 孤立词语音识别 6.3 连续词语音识别 6.4 说话人识别 6.4.1 说话人识别概述 6.4.2 说话人识别特征选取 6.4.3 说话人识别系统的结构 6.4.4 说话人识别中的识别方法 6.4.5 说话人识别中需进一步研究的问题 6.5 语音信号预处理 6.6 语音信号识别特征提取 6.7 语音信号识别方法 6.8 隐马尔可夫模型基本原理及在语音识别中的应用 6.8.1 马尔可夫链 6.8.2 隐马尔可夫模型的定义 6.8.3 隐马尔可夫模型的三个问题 6.8.4 隐马尔可夫模型在语音识别中的应用 6.9 动态时间规整算法参考文献第7章语音信号的合成 7.1 概述 7.2 语音合成的基本方法 7.2.1 以单词为基础的合成方法 7.2.2 以音节为基础的合成方法 7.2.3 以音素为基础的合成方法 7.3 共振峰合成法 7.4 线性预测合成法 7.5 语音合成专用硬件介绍 7.6 PSOLA算法合成语音 7.7 文语转换系统参考文献第8章语音信号定位与分离技术 8.1 声源定位技术 8.1.1 基于麦克风阵列的定位方法 8.1.2 基于人耳听觉机理的声源定位 8.2 语音分离技术 8.2.1 计算听觉场景分析 8.2.2 计算听觉场景分析的语音分离模型 8.2.3 独立分量分析 8.3 声源定位与语音分离实现方法参考文献第9章基于听觉机制的语音识别 9.1 人耳的听觉机制 9.1.1 人耳听觉中枢的物理结构 9.1.2 人耳听觉中枢的听觉机理 9.2 人耳听觉系统的基本模型 9.2.1 人耳听觉系统的外周听觉模型 9.2.2 人耳听觉系统的内毛细胞模型 9.2.3 人耳听觉系统的重合神经元模型 9.3 多声源环境下人耳语音定位模型 9.3.1 双耳线索 9.3.2 耳廓效应 9.3.3 双耳时间差模型 9.3.4 多声源环境下声源定位系统的设计 9.4 多声源环境下人耳语音分离模型 9.4.1 语音信号分离的反演模型 9.4.2 语音信号分离系统的设计 9.5 基于听觉机制的语音识别系统参考文献第10章基于语音的人机交互及应用 10.1 人机交互的研究及发展 10.1.1 人机交互概述 10.1.2 人机交互的研究内容 10.1.3 人机交互的发展历程 10.2 语音人机交互及其应用 10.2.1 语音人机交互概述 10.2.2 语音人机交互与智能轮椅 10.2.3 语音人机交互与智能电视 10.2.4 语音人机交互的其他应用参考文献
标签
缩略图
书名	语音处理及人机交互技术/智能科学技术著作丛书
副书名
原作名
作者
译者
编者	张毅//刘想德//罗元
绘者
出版社	科学出版社
商品编码（ISBN）	9787030303240
开本	16开
页数	200
版次	1
装订	平装
字数	252
出版时间	2016-03-01
首版时间	2016-03-01
印刷时间	2016-03-01
正文语种	汉
读者对象	普通大众
适用范围
发行范围	公开发行
发行模式	实体书
首发网站
连载网址
图书大类	计算机-操作系统
图书小类
重量	0.324
CIP核字	2016039549
中图分类号	TP391
丛书名
印张	13.5
印次	1
出版地	北京
长	238
宽	169
高	11
整理
媒质	图书
用纸	普通纸
是否注音	否
影印版本	原版
出版商国别	CN
是否套装	单册
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	天风海雨吟啸行(东坡词的智慧人生)/走近古典丛书古今骗术揭秘(现代卷十一五普法教育大众读物) 辩证唯物主义和历史唯物主义原理/高等学校文科教材吾国吾民(大师的文化课)/大师讲堂丛书经典导读(大师的国学课)/大师讲堂丛书禅是心中一盏灯写意画范草虫/荣宝斋国画技法丛书映色(花境号2008映色总第22辑) 爱黄裳临床护士三基自测(护理学基础分册) 写意画范花卉/荣宝斋国画技法丛书纵隔影像诊断学(精) 古今名医药论爱的教育/亲近文学走进名著屈原传李格非传当代妙方验方精粹诊家正眼(四言脉诀白话解)/中医传世歌诀白话解丛书今日价值投资(第3版) 记忆(京鲁明清古民居) 二十几岁要懂得的99条人生经验秘书学概论(高职高专文秘类课程规划教材) 计算技术与财经技能(高职高专会计与电算化会计类课程规划教材) Dreamweaver网页设计与制作(21世纪高等院校软件技术专业规划教材) 面向对象的数据结构(Java版21世纪高职高专软件技术专业规划教材) 极速看图 Iridient Developer for mac LuoApp骆谱条码标签打印软件爱普生4880L打印机驱动佳能mf8180c打印机驱动惠普1505打印机驱动惠普officejet j3606打印机驱动惠普officejet j4660打印机驱动 Ocenaudio(音频编辑软件) 萤石云视频客户端 A Memoir Blue 我是谁？高层都市幽灵线：东京小缇娜的奇幻之地埃博拉病毒2：生存星光咖啡馆与死神之蝶庆余年愤怒的小鸟星球大战Mac 贝壳婚事不可告人废材女侠晓朝夕理科生坠入情网不抛弃遇上不放弃初夏的甜蜜约定你好，我的对面男友蝶影夜夜相见不识君