登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

『簡體書』语音识别:模式、算法设计与实践

書城自編碼: 3938133
分類: 簡體書→大陸圖書→計算機/網絡程序設計
作者: 董雪燕
國際書號(ISBN): 9787113304225
出版社: 中国铁道出版社
出版日期: 2024-01-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 554

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
饲渊
《 饲渊 》

售價:NT$ 223.0
现金为王:把利润留下来,把成本降下去
《 现金为王:把利润留下来,把成本降下去 》

售價:NT$ 386.0
经纬度丛书·巴勒斯坦人的故事:流亡者的悲情、绝望与抗争
《 经纬度丛书·巴勒斯坦人的故事:流亡者的悲情、绝望与抗争 》

售價:NT$ 493.0
改变世界的哲学家们
《 改变世界的哲学家们 》

售價:NT$ 493.0
将军
《 将军 》

售價:NT$ 269.0
墓志的生成及其在唐代的衍变研究
《 墓志的生成及其在唐代的衍变研究 》

售價:NT$ 549.0
理解中国经济:在大变局中读懂新机遇
《 理解中国经济:在大变局中读懂新机遇 》

售價:NT$ 252.0
饥饿与国家:苏丹的饥荒、奴隶制和权力(1883~1956)
《 饥饿与国家:苏丹的饥荒、奴隶制和权力(1883~1956) 》

售價:NT$ 386.0

編輯推薦:
(1)理论与实践相结合读者不仅可以看到理论模型的设计思想 ,还可以通过代码实践加深对算法的理解 , 更可以看到算法是如何去解决具体的语音识别问题的。
(2)语言有亲和力在不失严谨的前提下 ,增加文字表达的活泼度和内容表达的图形化展示程度,保证读者能够 一步 一步地深入理解 , 而不是仅仅停留在数学公式的简单介绍层面。
(3)分享作者多年的经验 ,让内容“有血有肉”在书中适当位置嵌入过来人的思考和经验,一 来让读者避坑 , 二 来提供 一 些问题的解决思路。
(4)案例丰富本书融入了多个案例 , 目的是展示算法是如何解决实际问题的 。 同时 ,横向算法的比较也很必要 ,这样能帮助读者透彻理解不同算法的优缺点。
內容簡介:
随着深度学技术和计算机硬件设备的发展,作为自然语言处理领域重要课题的语音识别技术发展迅速,部分应用开始落地,实践流程也日渐成熟。 本书凝聚作者多年实践心得和经验,力求用抽丝剥茧的方式帮读者梳理出语音识别的学与提升之路,涉及语音识别发展脉络、知识地图、模式识别、核心算法和实践案例,最终形成“基础知识—算法理论—实践”的完整闭环,旨在帮助刚入行的语音识别从业人员梳理知识框架,熟悉开发流程,积累实践经验。
關於作者:
董雪燕,北京联合大学讲师,澳大利亚昆士兰科技大学计算机科学博士,主要研究领域为语音识别,以第一作者身份发表数十篇SCI,EI英文文章,国内核心期刊文章2篇;回国后参加设计和编写多个自然语言处理(偏重于语音识别模块)的实践项目。
內容試閱
说起人工智能 ,大家都不会感到陌生 ,科学家 一直在致力于让计算机能够像人类 一 样处理各类信息 ,并且能够做出合理的决策 ,最终让计算机与人类 一样无差别的工作和 交流 。最初 ,借鉴仿生学的思想 ,人们希望打造出的智能计算机 ,是能够像人 一样具有眼 睛看到事物 ,拥有耳朵听到声音 ,具有发声器官可以说话 ,还要学会阅读并书写文字 ,未 来还能“ 长”出鼻子闻到气味 。总之 , 只要能够发明出收集所有信息的传感器 ,通过数字 化的处理和强大的算法分析能力 , 理论上是可以让计算机做到和人类 一 样智能化的。 当然更理想的是“ 超越人类”,这需要发挥计算机擅长的大规模运算能力和算法的客观 化分析能力 ,避免人类由于体力不支和主观情感造成的失误 ,最终计算机工作的效率 一 定会比人类高出很多倍 ,从而解放许多从事重复性工作的劳动力 ,让人们有更多时间去 享受生活。
目前来看 ,这仍然是 一种理想化目标 , 虽然每年都有大批科技创新者投入人工智能 的相关研究 ,也取得了不错的进展 。但是某些社会学家和人文学家对人工智能提出质 疑 ,并担心计算机会取代人类 ,扼杀人类的文化 。无论怎样 , 有讨论总是好的 ,科技是需 要发展的 , 因为新技术能解决许多问题 , 当然我们更希望计算机是为人类服务的 。 因此 , 对人工智能的发展 ,我们应该努力让它更好 , 同时保持敬畏之心 , 不让它偏离为人类服 务的总目标。
语音识别属于人工智能中 一个十分重要的课题 ,终极目标是让计算机与人类能够 通过 口语“ 沟通”,让计算机听懂我们说的话 。从技术上说 ,研究语音识别算法是为了实 现“ 计算机准确地将人类发出的语音翻译成文字”,这看上去是 一项并不复杂的任务 , 然 而 , 由于口语表达的个性化和说话场景的复杂化 , 比如方言、说话人的个性特征 , 以及嘈 杂环境下的口语交流等因素 ,导致计算机接收到的信息是十分复杂的 ,这无疑增加了语 音识别的难度。
从学科发展来看 ,语音识别是 一个典型的综合性学科 , 涉及语音学、数字信号处理、 模式识别和人工智能等诸多学科 。每 一个学科的学习都具有 一 定的难度 ,这是让许多 初学者对语音识别望而却步的 一个主要原因 。另外 ,从数据驱动为主的算法研究来看 , 公共的语音识别的数据量是较小的 , 尤其是与图像识别研究中的公共数据集相比更是 少得可怜 ,这也让许多从业者和研究人员再次打起退堂鼓 , 毕竟数据收集的成本是很高 的 ,不仅要满足数据个体化的多样性 ,还要满足大体量的要求 ; 同时 , 高昂的人工标注成 本也是让许多研究者不敢涉足的主要原因。
不过我们也要看到 ,语音识别经过了多年的发展 , 随着深度学习技术和计算机硬件设备的发展 ,其发展速度十分迅猛 ,在实际生活中已经得到了广泛应用 。现在生活中随 处可见语音识别的应用 , 比如微信中的语音转文字 , 以及 一 些语音输入法的工 具 , 甚至 一 些大型的网站也为发表评论的用户提供了语音转文字的输入方式 。可喜的是 ,在发 音清晰的情况下 , 目前的技术可以做到与人类匹敌的水平 ,但是在 一 些对安全性和及时 性要求很高的场景下 ,语音识别仍然不是完美的 , 比如嘈杂环境、多人交谈环境等 ,仍旧 无法与人类的水平相适应 。 因此 ,还需要更多人投身到语音识别的研究中 , 不断克服困 难 ,让计算机能够更懂人类的 口语 ,从而提供更好的服务。
本书的写作初衷是希望鼓励更多人加入语音识别研究的队伍中 , 以帮助语音识别 技术发展得更好。
本书特色
(1)理论与实践相结合
对语音识别领域中的重要算法做了详细说明 , 并辅以代码实践 , 帮助读者更好地理 解 。本书不是只讲理论 ,而是让理论与实践相结合 ,读者不仅可以看到理论模型的设计 思想 ,更重要的是可以通过代码实践 , 加深对算法的理解 , 同时可以看到算法是如何去 解决具体的语音识别问题的。
(2)语言有亲和力
站在读者的角度 ,本书对算法中的理论给出更具亲和力的讲解方式 ,在不失严谨的 前提下 ,保证读者能够更好地理解算法本身 。作者不惜长篇文字介绍 , 目的是搭建一个个小梯子 ,保证读者能够一步 一步地深入理解 , 而不是仅仅停留在数学公式的简单介绍 层面 ,在必要的时候也有 一 些图形化的展示 , 这 一 切都是为了保证内容不枯燥且易于 理解。
(3)分享作者多年的经验 ,让内容“有血有肉”
根据笔者的经验,一 些初学者在刚接触语音识别技术时 , 因过于纠结一个小问题不 知如何下手 ,导致无法继续进行 。笔者从事语音识别研究多年,有一些个人见解 ,在书中适当位置 ,以过来人的思考和经验分享出来,一来让读者避坑,二来也提供一些问题的解决思路 ,这对于初学者在学习中遇到“ 拦路虎”时将大有帮助。
(4)案例丰富
算法的理解是为了解决问题 ,如果只停留在单个算法的理论学习层面 , 显然无法发 挥学习真正的价值 。 因此 ,本书融入了多个案例 ,目的是展示算法是如何解决实际问题的 。 同时 ,横向算法的比较也很必要 ,这样能帮助读者透彻理解不同算法的优缺点 ,从而更好地选择对自己有用的算法 ,形成科学的实验思维。
本书内容
概括来看 ,本书的内容主要分为四个部分 ,详细如下 :
第一部分为语音识别概述( 第 1 章) 。在了解 一个研究领域之前,先从整体上把握 这个领域的全貌是十分必要的。对语音识别的发展脉络给出详尽的阐述,这对刚进入 语音识别研究的读者大有裨益,也可为已经从事语音识别工作的人员提供一份知识地图,可以随时从中选取感兴趣的内容。
第二部分为学习语音识别应该了解的基础知识( 第 2-5 章)。如开篇所讲 ,语音识 别涉及多个学科 ,要想真正理解并从事相关研究 , 必须要掌握这些基本的知识。因此 ,第2-4章以语音识别涉及的数学理论基础、模式识别理论、语音信号的背景知识为脉络,向读者揭示重要的基础知识。第5章是关于代码实践的准备章节,因为本书主打算法的实践讲解,因此 ,提前搭建好相关的Python编程环境,并做好代码实践准备是十分必 要的。
第三部分为语音识别系统中核心算法的梳理( 第 6-9 章) 。语音识别系统的实现 中是有一个公认的处理框架的 ,在框架中的每一个阶段都有一套核心的算法,即数据预处理、特征提取和分类,因此 ,本部分内容就是在围绕这些核心算法展开阐述 , 并辅以实 践代码。
第四部分为两个语音识别系统的具体案例( 第 10 -11 章)。基于上一部分算法的阐述 ,本书最后两章综合案例的重点是告诉读者算法是如何应用到一个具体的语音识别问题中的,这样有助于读者理解算法的实践应用。最终形成“基础知识—算法理论—实践”的完整闭环。
为读者制定的学习路径和职业规划
(1)语音识别的学习者
如果你是本科生或者在读研究生 ,希望选择语音识别作为自己的研究方向 ,那么建 议你将语音识别所涉及的基础学科知识先理清楚 , 毕竟想要深入研究一门学问 ,打好基础是十分重要的 。如果想要锁定语音识别领域中 一个感兴趣的问题 , 可以参考顶级会 议的论文进展和学术圈的发展动态 。例如对某一类算法或应用感兴趣 , 那么围绕该问题 ,找到已有的算法实现,不断实验和试错,并提出更好的改进算法 ,应用于特定数据 ,最 终横向对比已有的算法 , 如果你的算法取得的效果比别人的好 , 那么恭喜你 , 一篇学术论文就此诞生了 ,研究之路也就随之展开。
(2)语音识别的从业者
如果你在某公司或科研机构任职 ,恰好有发展语音识别的业务需要 ,那么本书也可 以作为你的学习参考资料 。建议快速浏览开篇的语音识别概述,然后迅速梳理一下中间的基础知识点 ,找到自己的知识盲区 , 然后针对一个具体问题,去寻找可能的解决方案 ,哪里缺就专攻哪里,因为你的时间有限且目标明确,所以没有必要把所有基础知识都学习一遍。毕竟工作中更看重的是效率和解决当下的问题 ,时间和成本都是宝贵的 , 没有太多时间去试错。
(3)对语音识别感兴趣的读者
如果你只是正好路过 , 听闻语音识别很火 ,想要进来 一探究竟 ,看看是什么情况 。那 么建议你从本书的第 1 章看起 ,先对语音识别的发展有个大致了解 ,再去重点看看最后 的实践环节 ,看看自己对语音识别是否真的感兴趣 , 兴趣若深厚到想要从事相关方面的 研究和工作 ,那么建议再去学习前面的理论基础和重要算法 , 然后不断探索 , 能在一个方向努力做下去 ,会取得不错的进展。
写作心路历程
本书的写作之路并非一帆风顺 ,从最初框架的设定到每一篇章的谋篇布局 ,都经过了至少三次以上的改动 ,历经大概两年的时间 ,才完稿成型 ,直到呈现出今天的样子。这两年间最深刻且让人抓狂的事情大概有三件。
第一,Python 版本和算法中需要用到的框架和库之间的冲突。本书的所有代码都是 采用Python编码实现的 ,考虑到目前很多算法都有Python 框架的支持 ,Python实践是一个最佳选择 。但是这个选择在真正写作书中的案例时 ,却让笔者感受到极大的痛苦。因 为不同章节中的算法对于 Python支持的版本是不一样的 ,有的需要Python3.7 , 有的则 是高于Python3.9 版本就不支持 ,于是中间需要多次卸载Python环境 ,又重新安装所需 的 Python 版本 。而卸载的过程一不小心 ,可能导致依赖的其他包需要重新安装 ,甚至是 Anaconda 环境或 Jupyter 编译内核的删除与安装 。这些过程极其考验一个人的耐心 , 不仅耗时且容易让人感到十分沮丧。
第二,基于Python 的深度学习模型的训练对个人计算机或含有GPU的服务器是一个考验 。在运行深度学习算法时 ,笔者的个人计算机配置在Windows系统中算是比较高的 ,但是仍然在最后一章深度学习算法实践中遇到了计算机崩溃的一刻 。这也是深度 学习算法必然要经历的过程 ,原因可能是梯度爆炸导致计算量过大,于是导致云服务器上的GPU集群或实验室中共享的深度学习服务器 ,在模型训练过程中断或耗时过长 , 导 致整个训练不得不重新来过 。然后再局部调整代码 , 重新开启一轮训练 ,这时笔者往往心中暗自祈求别再出问题。
第三,写作 一本关于语音识别算法的书籍并不容易 , 因为语音识别涉及的学科众 多 ,如何更合理地将不同内容展开介绍需要花很多心思 。好在笔者在读博期间就坚定了好东西是改出来的信念 , 所以就坚信 一遍遍完善 , 总能有些新思路 , 也总会比前一个 版本更好 一 些。
最后 ,这些难熬的过程都走完之后,回头看 ,发现原来笔者也成长了, 毕竟这也算是一次新的学习过程,无论是温故,还是新内容的学习 ,都是一次又一次的挑战,最终都将成为笔者宝贵的经验。
源代码与数据集下载包
为方便读者学习 ,笔者把书中的源代码和数据集整理打包相赠。
勘误和鸣谢
结合多年的教学和科研经验,笔者力图做到用简洁的语言揭示深奥的算法原理。但受限于自身的水平 ,难免存在个人理解上的偏差,或者文字表达上的错误 ,还望得到广大读者的批评指正 ,笔者将虚心接受您的建议 ,使其日臻完善。
最后 ,要感谢中国铁道出版社有限公司所有编辑在本书出版过程中的辛勤付出。 还要感谢家人在我写作期间给予的生活方面的照顾,没有他们的支持与理解 ,本书不可能在今年完稿。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.