登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

『簡體書』深度学习理论与应用

書城自編碼: 3882590
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 蒙祖强,欧元汉
國際書號(ISBN): 9787302635086
出版社: 清华大学出版社
出版日期: 2023-07-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 330

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
夜航船(足本精校,4000+古代文化常识,尘封300多年的小百科,掌故查阅案头书,中国古人眼中的大千世界)
《 夜航船(足本精校,4000+古代文化常识,尘封300多年的小百科,掌故查阅案头书,中国古人眼中的大千世界) 》

售價:NT$ 381.0
无辜者的谎言
《 无辜者的谎言 》

售價:NT$ 279.0
创作与爱:托芙·扬松传
《 创作与爱:托芙·扬松传 》

售價:NT$ 493.0
建筑与时间:从上古城市到当代空间
《 建筑与时间:从上古城市到当代空间 》

售價:NT$ 437.0
重建:美利坚未完成的革命(1863—1877)
《 重建:美利坚未完成的革命(1863—1877) 》

售價:NT$ 946.0
复辟:查理二世和他的王国,1660—1685
《 复辟:查理二世和他的王国,1660—1685 》

售價:NT$ 773.0
向上社交:如何建立更有效的人际关系,让优秀的人主动靠近你
《 向上社交:如何建立更有效的人际关系,让优秀的人主动靠近你 》

售價:NT$ 330.0
九州天下:中国文化与中国人
《 九州天下:中国文化与中国人 》

售價:NT$ 325.0

建議一齊購買:

+

NT$ 335
《 深度学习入门与实践 》
+

NT$ 405
《 2023线性代数同步辅导与习题详解手写笔记(kira主编) 可搭线性代数教材(同济六版)云图书课包 》
+

NT$ 308
《 税收筹划(第十一版)(普通高等学校应用型教材·财税) 》
+

NT$ 202
《 医学生物化学与分子生物学实验 》
+

NT$ 466
《 概率论与数理统计教程(第3版) 》
+

NT$ 1011
《 数据挖掘的原理、方法、技术与应用 》
編輯推薦:
本书基于PyTorch框架介绍深度学习的有关理论和应用,以Python为实现语言,兼顾理论与应用、原理与方法,集系统性、实用性、便捷性和易入门性于一身,实例丰富,所有代码全部经过调试和运行。
內容簡介:
本书基于PyTorch框架介绍深度学习的有关理论和应用,以Python为实现语言。全书共分10章,内容包括深度学习的概念和发展过程、感知器、全连接神经网络、卷积神经网络、若干经典CNN预训练模型及其迁移方法、深度卷积神经网络应用案例、循环神经网络、基于预训练模型的自然语言处理、面向模型解释的深度神经网络可视化方法、多模态学习与多模态数据分类等。 本书兼顾理论与应用、原理与方法,集系统性、实用性、便捷性于一体,易于入门,实例丰富,所有代码全部经过调试和运行。此外,每一章后面都配有适量的习题,供教学和学习参考使用。 本书可作为各类高等学校人工智能和计算机相关专业的“人工智能”或“机器学习”课程的教材,也可作为人工智能、深度学习爱好者和初学者的自学教材,以及从事人工智能课题研究和应用开发人员的参考用书。
目錄
第1章绪论与PyTorch基础/1
1.1人工智能与神经网络1
1.2深度学习2
1.2.1什么是深度学习2
1.2.2深度学习的发展过程3
1.2.3深度学习的基础网络4
1.3建立PyTorch的开发环境4
1.3.1Anaconda与Python的安装4
1.3.2PyCharm和PyTorch的安装5
1.3.3PyTorch的Hello World程序6
1.4张量基础7
1.4.1张量的定义及其物理含义7
1.4.2张量的切片操作10
1.4.3面向张量的数学函数13
1.4.4张量的变形16
1.4.5张量的常用运算17
1.4.6张量的广播机制21
1.4.7梯度的自动计算22
1.4.8张量与其他对象的相互转换23
1.4.9张量的拼接24
1.5初识PyTorch框架25
1.5.1一个简单的网络模型25
1.5.2访问网络模型的各个网络层27
1.5.3访问模型参数及模型保存和加载方法29
1.6本章小结30
1.7习题31
第2章感知器——神经元/32
2.1感知器的定义32
2.2激活函数33深度学习理论与应用目录2.3感知器的训练34
2.3.1监督学习和无监督学习34
2.3.2面向回归问题的训练方法35
2.3.3面向分类问题的训练方法43
2.4使用PyTorch框架46
2.4.1PyTorch框架的作用47
2.4.2使用PyTorch框架实现感知器47
2.5本章小结52
2.6习题53
第3章全连接神经网络/54
3.1构建一个简单的全连接神经网络——解决二分类问题54
3.1.1一个简单全连接神经网络的构建和训练54
3.1.2程序代码解释及网络层的构建方法56
3.2全连接神经网络的构造方法59
3.2.1网络层的定义59
3.2.2网络结构的实现60
3.2.3从网络结构判断网络的功能62
3.3几种主流的损失函数62
3.3.1nn.CrossEntropyLoss()和nn.NLLLoss()函数63
3.3.2nn.MSELoss()函数66
3.3.3nn.BCELoss()和nn.BCEWithLogitsLoss()函数66
3.3.4nn.L1Loss()函数67
3.4网络模型的训练与测试68
3.4.1数据集分割68
3.4.2数据打包69
3.4.3网络模型的训练方法70
3.4.4梯度累加的训练方法71
3.4.5学习率衰减在训练中的应用72
3.4.6网络模型的测试74
3.4.7应用案例——波士顿房价预测76
3.5正向计算和反向梯度传播的理论分析81
3.5.1正向计算81
3.5.2梯度反向传播与参数更新85
3.6本章小结89
3.7习题90
第4章卷积神经网络/91
4.1一个简单的卷积神经网络——手写数字识别91
4.1.1程序代码91
4.1.2代码解释94
4.2卷积神经网络的主要操作96
4.2.1单通道卷积96
4.2.2多通道卷积100
4.2.3卷积操作的PyTorch代码实现103
4.2.4池化操作及其PyTorch代码实现105
4.2.5relu()激活函数及其应用107
4.2.6感受野109
4.3卷积神经网络的设计方法109
4.3.1基本设计原则109
4.3.2网络结构查看和参数量计算110
4.3.3一个猫狗图像分类示例111
4.4过拟合及其解决方法116
4.5本章小结117
4.6习题117
第5章若干经典CNN预训练模型及其迁移方法/119
5.1一个使用VGG16的图像识别程序119
5.1.1程序代码119
5.1.2代码解释122
5.2经典卷积神经网络的结构124
5.2.1卷积神经网络的发展过程124
5.2.2AlexNet网络125
5.2.3VGGNet网络126
5.2.4GoogLeNet网络与1×1卷积核128
5.2.5ResNet网络130
5.2.6EfficientNet网络131
5.3预训练模型的迁移方法132
5.3.1预训练网络迁移的基本原理132
5.3.2VGG16的迁移案例133
5.3.3GoogLeNet的迁移案例136
5.3.4ResNet的迁移案例140
5.3.5EfficientNet的迁移案例142
5.4本章小结145
5.5习题145
第6章深度卷积神经网络的应用案例/146
6.1人脸识别146
6.1.1人脸识别的设计思路146
6.1.2人脸识别程序147
6.2语义分割152
6.2.1从零开始构建语义分割网络152
6.2.2使用预训练模型构建语义分割网络160
6.3目标检测161
6.3.1从零开始构建目标检测网络161
6.3.2使用Fasterrcnn构建目标检测网络165
6.4生成对抗网络172
6.4.1生成手写数字图片173
6.4.2生成花卉图片176
6.4.3条件性生成对抗网络179
6.5本章小结182
6.6习题182
第7章循环神经网络/183
7.1一个简单的循环神经网络——航空旅客出行人数预测183
7.1.1程序代码183
7.1.2代码解释187
7.2循环神经网络应用188
7.2.1循环神经网络的基本结构188
7.2.2从“零”开始构建一个循环神经网络190
7.3长短时记忆网络(LSTM)192
7.3.1LSTM的结构和特点192
7.3.2LSTM的使用方法195
7.3.3深度循环神经网络199
7.3.4双向循环神经网络199
7.3.5LSTM的变体——GRU200
7.4文本的表示201
7.4.1词的独热表示201
7.4.2Word2Vec词向量202
7.4.3词嵌入表示202
7.5基于LSTM的文本分类206
7.6基于LSTM的文本生成210
7.6.1语言模型与文本生成210
7.6.2类不平衡问题211
7.6.3文本生成案例212
7.7本章小结216
7.8习题216
第8章基于预训练模型的自然语言处理/217
8.1Seq2Seq结构与注意力机制217
8.1.1Seq2Seq结构217
8.1.2注意力机制221
8.2Transformer及其在NLP中的应用225
8.2.1Transformer中的注意力机制225
8.2.2Transformer的结构226
8.2.3Transformer的位置编码与嵌入226
8.2.4Transformer的使用方法229
8.2.5Transformer应用案例232
8.3BERT及其在NLP中的应用238
8.3.1关于BERT238
8.3.2BERT的使用方法240
8.3.3基于BERT的文本分类243
8.3.4基于BERT的阅读理解247
8.4基于GPT的文本生成254
8.4.1关于GPT254
8.4.2使用GPT2生成英文文本——直接使用255
8.4.3使用GPT2生成中文文本——微调方法256
8.5视觉Transformer(ViT)260
8.5.1关于ViT260
8.5.2ViT预训练模型的使用方法260
8.5.3基于ViT的图像分类262
8.6ChatGPT及其使用方法264
8.6.1关于ChatGPT264
8.6.2ChatGPT的使用方法266
8.7本章小结269
8.8习题269
第9章面向解释的深度神经网络可视化方法/270
9.1CNN各网络层输出的可视化270
9.2CNN模型决策原因的可视化方法274
9.2.1基于类别权重的类激活图(CAM)274
9.2.2基于梯度的类激活图(CAM)277
9.3面向NLP任务的可视化方法281
9.3.1NLP任务中注意力机制可视化的一般方法281
9.3.2自注意力机制的可视化282
9.4本章小结284
9.5习题285
第10章多模态学习与多模态数据分类/286
10.1多模态学习286
10.1.1多模态学习的发展过程286
10.1.2多模态学习的主要任务287
10.2多模态数据分类288
10.2.1文本特征提取方法289
10.2.2图像特征提取方法289
10.2.3多模态数据融合方法289
10.3多模态数据分类案例291
10.4本章小结296
10.5习题297
参考文献/298
內容試閱
2022年11月,OpenAI公司发布了ChatGPT。该产品在极短的时间内迅速受到了人们的空前关注,被认为是人工智能史上继AlphaGo战胜了李世石以来的又一个里程碑事件。这些事件掀起了一轮又一轮的人工智能研究风暴,使得“深度学习”“神经网络”“人工智能”等术语像流行歌词一样为世人所知晓。实际上,在此之前LannYeCun等于1998年提出了最早的卷积神经网络——LeNet,Hinton和他的学生Salakhutdinov于2006年提出深度学习的概念,Hinton的学生Krizhevsky Alex于2012年提出了LeNet的加宽版——AlexNet,这些标志着深度学习时代的来临。2014年GoogLeNet和VGG同时诞生,2015年残差神经网络ResNet诞生。围棋事件只不过是新一轮人工智能研究风暴的导火索,此后还出现了AlphaGo的升级版——AlphaGo Zero、预训练模型EfficientNet、刷新人们对深度神经网络认知的Transformer框架及基于此框架大型预训练模型BERT和GPT等,而ChatGPT的出现更是令人对人工智能拍案叫绝、赞不绝口。
与往次不同的是,本次人工智能革命不但有扎实的理论和技术为基础,在图像识别、语音处理、自然语言处理等领域中均获得了突破性进展,而且有强力的资本注入,有市场的需求,形成了科技、产业协同发展的新模式,更是国家战略(工业4.0——智能化)发展的需要,推动着人类进入了“AI ”时代。因此,我们有理由相信,在可预见的未来,人工智能一直都是带动各行各业发展的重要引擎,是新一轮经济腾飞的发动机。人工智能及相关产业的从业者已是不计其数,将来也会创造更多的就业岗位。
在“AI ”时代,作为当代的大学生,人工智能和计算机类专业等工科类学生,甚至文科类学生,都在学习人工智能和应用人工智能,都希望运用人工智能理论和技术解决各自领域中的科学问题、技术难题等。虽然现在学生学习深度学习的热情很高,但是编者注意到,要掌握能够学以致用的深度学习技术和方法并非易事。其原因主要在于: ①虽然现在网络资料、文献书籍非常多,但其呈现的知识碎片化严重,学生往往容易迷失在这些浩如烟海知识海洋中,需要花费大量的时间才能整理出知识脉络,形成自己的知识结构,导致学习效率十分低下。②市场上关于深度学习的书籍虽然已经非常多了,但有的过于偏重理论,主要阐述深度学习的理论知识,只适合于有较好深度学习基础的读者,像学生这样的初学者,看了以后也不知道如何入手。有的书籍又过于偏重所谓的实践技能,它们往往罗列出一大堆代码,却不分析代码背后的基本原理和相关理论知识,使得学生为了学习深度学习而学习代码,不能举一反三,更不能学以致用,以至于最后还是“盲人摸象”,收获甚微。③有很多学生是带着热情来学习深度学习的,但学习热情是相对的,需要有学习成功的喜悦来加持。而实际情况往往是,学生做了很多努力,却由于知识碎片化、缺少合适的书籍等因素不知从何入手,多次尝试也难以达到预期的目标,进而难以坚持学习,热情自然也就消退了,即使能够坚持下来,也难以达到学习深度学习的既定目标。
深度学习理论与应用前言笔者长期从事人工智能和深度学习方面的教学和科研工作,也一直指导本科生和研究生从事这方面的课题研究,主要有两点体会比较深刻: ①每次面对新一届的学生时,都需要从头给他们培训深度学习方法的理论知识和实践知识,以使得他们尽快进入研究课题的门槛,很耗费时间和精力。如果有一本兼顾理论与应用、综合原理与方法、适合初学者的深度学习书籍,那么这种培训工作就容易得多了,甚至让学生自己学习就可以了,从而省去了这个培训环节。②由于缺乏系统的学习资料,学生需要整理大量的笔记和资料,以形成自己的知识体系,结果导致学习效率低下,严重影响课题的研究进度。对研究生而言,由于上述原因,他们往往要利用一年左右的时间来系统地学习深度学习,这导致他们真正花在课题上的研究时间非常有限。对本科生而言,他们大多在大三或大四时开始接触和学习深度学习。也由于上述原因,加上考研、找工作等多种因素,他们根本没有较长时间来学习深度学习,因此在做课题研究时往往从网上下载一段代码来改一改,能够运行就可以,结果往往是“只知其然,而不知其所以然”,而且学的内容很片面,其效果也就是“盲人摸象”。实际上,如果有一本合适的深度学习入门教材,本科生和研究生都可以用2~3个月的时间即可系统地学习深度学习的有关理论和应用知识,那么老师的指导和学生的学习都会变得相对容易,而且指导和学习的操作性和针对性都更强。
本书正是在考虑到上述三个原因和两点体会的基础上编写的。从案例收集、教学经验积累开始,到最后的撰写,大约经历了三年时间,本书终于和读者见面。本书的撰写不仅是深度学习知识的书面文字化,更是笔者多年从事人工智能和深度学习教研的心得体会与经验总结。本书共分为10章,第1章介绍深度学习的概念和发展过程,重点介绍张量的基本操作;第2章介绍神经网络的基本计算单元——感知器;第3章介绍全连接神经网络及梯度计算和参数优化的理论基础;第4章介绍卷积神经网络,涉及网络的主要操作和设计方法等;第5章介绍若干经典CNN预训练模型及其迁移方法;第6章介绍深度卷积神经网络的应用案例;第7章结合文本处理介绍循环神经网络;第8章介绍基于预训练模型的自然语言处理技术和方法;第9章介绍面向深度神经网络可解释性的可视化方法;第10章介绍多模态学习与多模态数据分类,这是人工智能比较前沿的领域。
本书的特点体现在四个方面: ①坚持“一个中心,两个基本点”的基本原则。一个中心是指理论中心,即本书结合损失函数的设计,针对基本网络结构,详细介绍了基于梯度反向传播的参数训练理论和方法,而且内容由浅入深,通俗易懂,使读者不但知其然,而且知其所以然。一个基本点是针对图像处理,系统介绍卷积神经网络的理论和方法,包括优化和设计理论,基于PyTorch的开发方法,然后介绍卷积神经网络的若干经典预训练模型。另一个基本点是针对序列数据,尤其是文本数据,系统地介绍了循环神经网络的基本原理和使用方法,进而介绍了Transformer以及基于Transformer的预训练模型。②系统性和实用性。本书不但从“零”开始介绍了深度神经网络的设计方法,而且介绍了相应预训练模型的使用方法,内容全面,涉及深度学习各方面的知识。读者不但可以深入、系统地理解深度模型的基本原理,而且可以“站在巨人的肩膀上”,通过使用已有的预训练模型并通过微调来解决面临的复杂问题,达到学以致用的目的。③易于入门。本书虽然包含了许多理论知识,但主要是高等数学中的知识,这些知识在大一和大二一般都学习过,而且本书尽量用通俗的语言加以阐述,用小例子帮助具体化,所以相关理论非常容易入门。与此同时,在许多章节的开头,尽量用一个简单的例子来“开胃”,让读者对复杂的设计方法有一个初步的感知,然后据此扩展,介绍相关的理论和知识。所以,本书内容整体上由浅入深,通俗易懂,非常容易入门。不管是工科类还是非工科类学生,都可以利用本书快速入门,跨越各自专业课题研究所需的深度学习技术门槛,为专业课题的实质性研究提供支持。④便捷性。为了方便读者阅览和学习,本书中每个程序代码一般都尽可能地在一个Python文件中编写完成(即“一个程序一个Python文件”),不涉及复杂的文档结构,以保证读者能够聚焦关键信息和掌握核心知识。同时,本书尽可能删除无关和不必要的代码,只保留与知识点密切相关的代码和维持程序运行的必要代码,保证每个程序代码都可以独立运行,同时提供相应的数据集。
总之,本书由浅入深、通俗易懂,具有较好的操作性,所有代码全部通过调试运行。本书兼顾理论与应用、原理与方法,内容涵盖深度学习的基础理论和主流方法,实例翔实,逻辑性强,结构清晰,条理清楚,重点突出。此外,每一章后面都配有适量的习题,供教学和学习参考使用。
本书可作为各类高等学校人工智能和计算机相近专业的深度学习、神经网络、机器学习、自然语言处理、图像处理、模式识别等人工智能课程及相关课程的教材,也可以作为人工智能、深度学习爱好者和初学者的自学教材,以及从事人工智能和深度学习应用开发的人员参考。本书提供的所有的源代码和本书案例中使用到的数据集,以及教学大纲和PPT课件等资源,都可以从清华大学出版社网站(http://www.tup.com.cn/)免费下载。读者如有问题或需要技术支持,联系longqm@163.com。
全书由广西大学蒙祖强教授执笔,欧元汉副教授审阅了本书全稿,研究生潘秋宇、莫书渊、徐洋、梁羿、郑毅等为程序调试做了大量工作,研究生王新育、付闻达、陈舒静、陀海铭、张道胜、施子豪等为稿件的纠错提供了大量帮助。此外,参与本书编写、资料整理和调试程序的还有白琳、杨丽娜等老师。在此,对他们的贡献表示由衷的感谢!
感谢所有关心和支持本书编写和出版的人员,包括广西大学武新章教授、陈宁江教授,以及一些老师、研究生和技术人员,同时感谢清华大学出版社的领导和编辑,他们为本书的编写和出版提供了大量的指导。本书参考了相关文献和网络资源,在此,对这些资料的著作者表示衷心感谢。
编者2023年3月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.