登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2025年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2026年01月出版新書

2025年12月出版新書

2025年11月出版新書

2025年10月出版新書

2025年09月出版新書

2025年08月出版新書

2025年07月出版新書

2025年06月出版新書

2025年05月出版新書

2025年04月出版新書

2025年03月出版新書

2025年02月出版新書

2025年01月出版新書

2024年12月出版新書

『簡體書』大语言模型基础教程

書城自編碼: 4199371
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者:
國際書號(ISBN): 9787302705024
出版社: 清华大学出版社
出版日期: 2025-12-01

頁數/字數: /

售價:NT$ 305

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
狄仁杰与武则天 武周革命与平民官僚的崛起 钤印版 汗青堂丛书163
《 狄仁杰与武则天 武周革命与平民官僚的崛起 钤印版 汗青堂丛书163 》

售價:NT$ 449
自恋主义文化
《 自恋主义文化 》

售價:NT$ 398
我是异类,你是怪物
《 我是异类,你是怪物 》

售價:NT$ 301
深夜的恋人们
《 深夜的恋人们 》

售價:NT$ 332
治未病常用中医外治法辑要
《 治未病常用中医外治法辑要 》

售價:NT$ 449
西方哲学史:插图典藏版
《 西方哲学史:插图典藏版 》

售價:NT$ 918
流血的仕途:李斯与秦帝国(全二册2026版)
《 流血的仕途:李斯与秦帝国(全二册2026版) 》

售價:NT$ 545
大学问·近代中国工业发展史(1860—1916)(著名历史学家张玉法先生学术代表作)
《 大学问·近代中国工业发展史(1860—1916)(著名历史学家张玉法先生学术代表作) 》

售價:NT$ 403

編輯推薦:
本书作者有多年的企业从业实际工作经验,教材定位准,内容实用,有大量的实用案例,适合学生和从业者学习。编辑QQ1102528884
內容簡介:
本书系统构建大语言模型的知识体系,内容从技术演进、核心原理到行业实践层层递进。其中,“基础篇”以技术发展脉络为轴,详细介绍从Word2Vec、Transformer到GPT系列模型的架构革新,深入剖析自注意力机制、预训练—微调范式及模型优化策略,并探讨如何应对数据质量、能耗效率与实时性能调优等问题。“应用篇”覆盖自然语言处理、医疗、金融、法律等八大领域的落地实践,结合智能问答、文本生成等场景,拆解Prompt工程方法论,并同步探讨大语言模型引发的就业变革、隐私风险与伦理争议。“前沿篇”聚焦多模态融合(视觉—语言交互、语音合成)、大语言模型可解释性(金融合规与医疗透明性需求)、对抗性攻击防御等关键技术突破,并展望超大规模模型、新型架构与全球协作的未来图景。本书既是人工智能开发者与自然语言处理工程师的技术全景图,也是产品经理与行业决策者的实践指南。通过跨领域应用解析(如医疗文献解析、金融风控自动化),助力初学者掌握大语言模型核心架构与训练逻辑,同时为从业者提供Prompt优化、多模态开发等进阶工具。本书也适合作为高校师生及相关研究机构的教材或参考用书。
關於作者:
张永涛,男,副教授,主要从事计算机方面的教学及科研工作,发表计算机方面论文10余篇。教授的课程:《大数据模型》、《嵌入式软件开发基础》、《人工智能技术》、《计算机网络原理》、《操作系统原理》、《数据分析》等。
目錄
基 础 篇
第1章 大语言模型的起源与发展2
1.1 从自然语言处理到大语言模型2
1.1.1 自然语言处理的基本概念2
1.1.2 早期自然语言处理方法与技术3
1.1.3 兴起的大语言模型:革新与潜力5
1.2 重要的里程碑与发展阶段7
1.2.1 Word2Vec和GloVe:向量化的起点7
1.2.2 从RNN到LSTM:序列模型的演进11
1.2.3 Transformer和BERT:自注意力机制的崛起14
1.2.4 GPT系列:大规模预训练模型的突破15
1.3 大语言模型的未来展望18
1.3.1 从GPT—4到GPT—N:未来可能的发展18
1.3.2 国内大语言模型的发展21
1.3.3 多模态和跨语言的挑战23
1.3.4 对可解释性、公平性和安全性的追求25
第2章 大语言模型的核心原理与技术27
2.1 深度学习与神经网络27
2.1.1 深度学习的基本原理27
2.1.2 神经网络的组成与工作方式29
2.1.3 神经网络的类型和适用场景32
2.1.4 深度学习在大语言模型中的应用34
2.2 词向量与语义表示36
2.2.1 词向量36
2.2.2 主要的词向量模型37
2.2.3 词向量的实际应用场景40
2.2.4 语义表示42
2.3 Transformer与自注意力机制45
2.3.1 Transformer的原理和架构45
2.3.2 自注意力机制的理论和实践46
2.3.3 Transformer在大语言模型中的应用49
第3章 训练大语言模型的挑战与解决方案53
3.1 数据收集与处理53
3.1.1 数据的来源和类型53
3.1.2 数据清洗和预处理55
3.1.3 数据质量对大语言模型训练的影响56
3.1.4 数据标注和增强56
3.2 模型训练与优化59
3.2.1 训练策略和技巧59
3.2.2 优化算法的选择和应用61
3.2.3 模型优化的挑战和解决方案65
3.2.4 模型优化的前景与机遇67
3.3 能源消耗与环境影响68
3.3.1 训练大语言模型的能源需求:挑战与现实68
3.3.2 对环境的潜在影响:碳排放与环保责任68
3.3.3 低能耗训练策略和技术:解决方案与展望68
3.3.4 总结与前景展望68
3.4 大语言模型在实时应用中的性能与响应优化69
3.4.1 实时应用的需求分析69
3.4.2 性能优化的核心技术70
3.4.3 实时应用案例分析73
3.4.4 技术方案的实施与未来前景74
应 用 篇
第4章 大语言模型在各领域的应用78
4.1 自然语言处理与机器翻译78
4.1.1 大语言模型在自然语言处理中的应用78
4.1.2 大语言模型在机器翻译中的应用79
4.1.3 未来的挑战80
4.2 智能问答系统与聊天机器人81
4.2.1 大语言模型在智能问答系统中的应用81
4.2.2 大语言模型在聊天机器人中的应用83
4.2.3 未来的机遇和挑战85
4.3 文本生成与创作辅助86
4.3.1 大语言模型在文本生成中的应用86
4.3.2 大语言模型在创作辅助中的应用89
4.3.3 未来的机遇和挑战91
4.4 医疗与生命科学93
4.4.1 大语言模型在医学文献解析中的应用93
4.4.2 大语言模型在疾病诊断和提供治疗建议中的应用95
4.4.3 未来的机遇和挑战97
4.5 法律与合规99
4.5.1 大语言模型在法律文本分析与合同审核中的应用99
4.5.2 大语言模型在法律问答与合规性审核中的应用101
4.5.3 未来的机遇和挑战102
4.6 教育与智能辅导104
4.6.1 大语言模型在个性化学习与教材生成中的应用104
4.6.2 大语言模型在自动化测评与辅导系统中的应用105
4.6.3 未来的机遇和挑战107
4.7 金融分析与金融风险管理109
4.7.1 大语言模型在金融文本解析与市场分析中的应用109
4.7.2 大语言模型在风险管理与合规自动化中的应用110
4.7.3 未来的机遇和挑战111
4.8 内容审核与舆情监控113
4.8.1 大语言模型在社交媒体内容审核中的应用113
4.8.2 大语言模型在舆情监控与虚假信息检测中的应用114
4.8.3 未来的机遇和挑战115
4.9 用户体验与交互设计117
4.9.1 用户体验设计原则117
4.9.2 交互设计的挑战118
4.9.3 改善用户体验的技术119
4.9.4 用户案例与设计实例120
第5章 Prompt的使用与优化122
5.1 Prompt工程的基本概念122
5.1.1 Prompt的定义与作用122
5.1.2 Prompt工程的发展与应用场景123
5.2 Prompt设计与构建原则124
5.2.1 简洁明了的Prompt设计124
5.2.2 问题与指令的具体性124
5.2.3 避免歧义的技巧124
5.2.4 引导模型回答的技巧125
5.3 Prompt优化技术125
5.3.1 Few-shot Prompting与Zero-shot Prompting125
5.3.2 思维链126
5.3.3 分层提示127
5.3.4 多步交互与反馈迭代128
5.4 特殊场景下的Prompt应用129
5.4.1 用于数据抽取的Prompt设计129
5.4.2 情感分析与文本分类中的Prompt130
5.4.3 代码生成与编程辅助131
5.4.4 偏见控制与公平性优化131
5.5 Prompt优化的实际案例分析132
5.5.1 交互式Prompt优化案例132
5.5.2 不同Prompt方法对生成结果的影响133
5.6 Prompt工程的未来趋势与前景134
5.6.1 Prompt的自动化生成与优化135
5.6.2 Prompt与多模态任务的结合135
5.6.3 Prompt优化的支持工具与平台136
5.6.4 Prompt工程的前景与挑战136
第6章 大语言模型对社会与伦理的影响138
6.1 AI对就业与经济的影响138
6.1.1 AI对就业市场的影响138
6.1.2 AI在经济发展中的角色142
6.2 隐私与安全问题145
6.2.1 AI和隐私的关系145
6.2.2 大语言模型在数据安全中的角色146
6.2.3 针对隐私和安全的策略和技术148
6.3 伦理与道德挑战150
6.3.1 AI伦理的关键问题150
6.3.2 大语言模型面临的AI伦理和道德挑战152
6.3.3 解决伦理和道德挑战的路径155
前 沿 篇
第7章 大语言模型的多模态融合160
7.1 视觉与语言的融合:从理论到实践160
7.1.1 多模态学习的理论基础160
7.1.2 视觉和语言融合的应用案例163
7.1.3 视觉和语言融合的未来趋势166
7.2 语音识别与语音合成170
7.2.1 语音识别的技术原理和应用170
7.2.2 语音合成的技术和应用172
7.2.3 大语言模型在语音识别和语音合成中的作用174
7.3 跨模态信息处理175
7.3.1 跨模态学习的理论基础175
7.3.2 跨模态信息处理的应用案例177
7.3.3 跨模态信息处理的未来趋势181
7.4 大语言模型与强化学习的结合185
7.4.1 强化学习与大语言模型的结合优势185
7.4.2 应用案例186
7.4.3 挑战与前景187
第8章 大语言模型的可解释性与透明性190
8.1 模型可解释性的重要性190
8.1.1 可解释性的定义和重要性190
8.1.2 大语言模型的可解释性挑战191
8.1.3 提升大语言模型可解释性的策略和方法192
8.2 可解释性方法与技术196
8.2.1 常见的模型解释技术196
8.2.2 大语言模型的特殊解释需求198
8.2.3 解释大语言模型的新技术和方法201
8.3 提高模型透明性的挑战与前景204
8.3.1 模型透明性的定义和重要性204
8.3.2 提高大语言模型透明性的挑战209
8.3.3 提高大语言模型透明性的策略和方法215
8.4 大语言模型在监管合规中的可解释性217
8.4.1 金融合规217
8.4.2 数据保护合规218
8.5 行业应用中的大语言模型透明性需求与实例分析220
8.5.1 透明性在金融业中的实例应用220
8.5.2 医疗和公共政策中的透明性需求221
第9章 大语言模型的安全性与鲁棒性223
9.1 对抗性攻击与防御223
9.1.1 对抗性攻击的基本概念223
9.1.2 对抗性攻击类型224
9.1.3 对抗性防御策略和技术227
9.2 大语言模型异常检测与过滤230
9.2.1 大语言模型异常检测的理论基础230
9.2.2 大语言模型在异常检测和过滤中的作用231
9.2.3 大语言模型异常检测与过滤的未来发展233
9.3 提升模型鲁棒性的方法与技术236
9.3.1 鲁棒性的定义和重要性236
9.3.2 提升大语言模型鲁棒性的主要方法237
9.3.3 鲁棒性提升的挑战和前景240
第10章 未来的大语言模型发展趋势243
10.1 超大规模模型与算法优化243
10.1.1 超大规模模型的优点和挑战243
10.1.2 算法优化的重要性和方法245
10.1.3 面向未来的模型和算法发展 249
10.2 新型架构与技术的探索253
10.2.1 当前流行的模型架构和技术253
10.2.2 新型架构和技术的探索和实践256
10.2.3 新型架构和技术的发展前景261
10.3 开放研究与全球合作264
10.3.1 开放研究的重要性和挑战264
10.3.2 全球AI合作的现状和重要性266
10.3.3 推动开放研究和全球合作的策略和途径268
参考文献271
內容試閱
在人工智能技术迅猛发展的今天,大语言模型已成为推动自然语言处理、多模态交互及行业智能化转型的核心驱动力。从早期的词向量模型到如今的千亿级参数模型,大语言模型不仅重塑了技术研发的范式,更在医疗、金融、教育、法律等领域展现出前所未有的应用潜力。本书旨在为读者提供系统性学习大语言模型的理论框架与实践指南,助力学术界与产业界把握这一技术浪潮的机遇。
1.行业背景与产业需求
近年来,大语言模型通过海量数据训练与自监督学习,逐步突破了传统自然语言处理的局限,实现了文本生成、语义理解、跨模态交互等复杂任务。以GPT系列、BERT、Transformer为代表的模型架构革新,推动了智能客服、自动编程、医学诊断等场景的落地应用。例如,在医疗领域,大语言模型可辅助解析医学文献并为临床决策提供参考信息;在金融行业,其能高效分析市场动态与风险数据,成为决策支持的重要工具。然而,模型的可解释性、伦理安全及能源消耗等问题仍亟待解决,这要求技术与应用的双向优化。
2.本书特色与结构设计
本书基于理论与实践结合的理念,系统梳理大语言模型的技术脉络与应用场景,具有以下特色。
(1)从基础到前沿的全覆盖:“基础篇”深入解析大语言模型的核心原理,涵盖Transformer架构、训练优化策略及环境影响,为读者构建扎实的理论基础;“应用篇”聚焦行业应用,通过医疗、法律、金融等领域的案例分析,展现技术落地的多样性与创新性。
(2)实战导向与前沿探索:专设“Prompt的使用与优化”“大语言模型的多模态融合”等章节,结合代码示例与优化技巧,指导读者解决实际开发中的难题;“前沿篇”探讨可解释性、安全性与未来趋势,如注意力可视化、多模态异常检测等前沿方向,为技术演进提供前瞻视角。
(3)社会伦理与产业平衡:针对大语言模型的伦理争议、隐私风险及就业影响,本书通过独立章节分析其社会效应,并提出技术治理的可行路径,倡导“技术向善”的发展理念。
3.致谢
本书的编写得益于学术界与产业界的广泛支持。许多优秀高校的工程教育经验为本书的案例设计提供了宝贵参考;开源社区的技术分享及行业报告是内容更新的核心驱动力。此外,书中部分案例源于实际项目,特别感谢参与技术验证的团队与合作伙伴。
尽管我们力求内容的准确性与时效性,但大语言模型领域的发展日新月异,疏漏之处在所难免。恳请读者不吝指正,我们将通过后续版本持续完善,与您共同探索这一充满可能的智能时代。
编著者
2025年9月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2026 (香港)大書城有限公司 All Rights Reserved.