登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2025年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2026年04月出版新書

2026年03月出版新書

2026年02月出版新書

2026年01月出版新書

2025年12月出版新書

2025年11月出版新書

2025年10月出版新書

2025年09月出版新書

2025年08月出版新書

2025年07月出版新書

2025年06月出版新書

2025年05月出版新書

2025年04月出版新書

2025年03月出版新書

『簡體書』RAG技术基础与开发实战

書城自編碼: 4215243
分類: 簡體書→大陸圖書→計算機/網絡人工智能
作者: 朱万林 编著
國際書號(ISBN): 9787122488886
出版社: 化学工业出版社
出版日期: 2026-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 525

我要買


** 我創建的書架 **
未登入.



新書推薦:
在别处安家:关于逃离、生存与梦想破碎之地
《 在别处安家:关于逃离、生存与梦想破碎之地 》

售價:NT$ 347
棉花王国 密西西比河流域的奴隶制与资本主义	(一部改写美国奴隶制认知的史学佳作)
《 棉花王国 密西西比河流域的奴隶制与资本主义 (一部改写美国奴隶制认知的史学佳作) 》

售價:NT$ 602
历史哲学 一部关于世界文明 理性与历史的终极思考
《 历史哲学 一部关于世界文明 理性与历史的终极思考 》

售價:NT$ 505
诡舍6完结篇蔽日开天
《 诡舍6完结篇蔽日开天 》

售價:NT$ 254
大学问·秦汉经济政策与经济思想史稿(jue版好书复活,读懂秦汉,就是读懂中国两千年的经济底色。)
《 大学问·秦汉经济政策与经济思想史稿(jue版好书复活,读懂秦汉,就是读懂中国两千年的经济底色。) 》

售價:NT$ 454
狄仁杰与武则天 武周革命与平民官僚的崛起 钤印版 汗青堂丛书163
《 狄仁杰与武则天 武周革命与平民官僚的崛起 钤印版 汗青堂丛书163 》

售價:NT$ 449
自恋主义文化
《 自恋主义文化 》

售價:NT$ 398
我是异类,你是怪物
《 我是异类,你是怪物 》

售價:NT$ 301

內容簡介:
本书基于DeepSeek模型,详细介绍RAG技术的原理与实战应用知识。本书共分为9章,从RAG基础概念、数据收集与处理、文本检索与生成技术到模型训练、优化与动态RAG的构建,全面覆盖了RAG开发的核心技术要点。书中详细讲解了向量化技术、检索算法、多模态嵌入及文本生成算法的实现过程,并提供了丰富的实际案例。此外,本书还特别介绍了如何利用多个模型构建高效的聊天助手,结合前沿的动态RAG方法提升系统性能。
本书不仅涵盖标准RAG的构建与提示工程,还深入讲解了高级RAG技术,如分块与向量化、重排与过滤、智能查询路由与响应合成等内容,并探讨了RAG的融合与评估方法。通过一系列系统化的案例与实操讲解,帮助读者全面掌握RAG技术的理论与实践。
无论你是人工智能领域的技术开发者、学术研究人员、高校师生,还是对大模型及检索生成技术感兴趣的初学者,本书都将为你提供从入门到进阶的全方位指导,助你在RAG开发与应用中获得深刻的理解与技能提升。
目錄
第1章 RAG开发基础 001
1.1 初步认识RAG 002
1.1.1 RAG的提出背景 002
1.1.2 RAG的工作原理 002
1.1.3 RAG的优势 003
1.1.4 RAG的挑战 004
1.2 RAG的架构 005
1.2.1 数据准备阶段 005
1.2.2 应用阶段 006
1.3 标准RAG 007
1.3.1 标准RAG的实现流程 007
1.3.2 提示工程 007
1.4 高级RAG 008
1.4.1 分块和向量化 008
1.4.2 搜索索引 008
1.4.3 重排和过滤 009
1.4.4 查询转换 010
1.4.5 聊天引擎 010
1.4.6 查询路由 011
1.4.7 智能体 011
1.4.8 响应合成 011
1.5 开发前的准备工作 011
1.5.1 RAG开发技术栈 012
1.5.2 用Ollama本地部署DeepSeek模型 012
1.5.3 申请DeepSeek API密钥 014
1.6 RAG程序实战体验 015
1.6.1 基于本地DeepSeek模型的AI助手 016
1.6.2 基于DeepSeek API的AI助手 017
第2章 数据收集与处理 020
2.1 数据收集 021
2.1.1 选择数据源的因素 021
2.1.2 常用的数据收集工具 022
2.2 数据增强 023
2.2.1 数据增强的常用方法 023
2.2.2 文本数据增强 024
2.2.3 基于LLM标注的标签混合 025
2.2.4 文本扩展增强 026
2.2.5 数据合成 028
2.2.6 噪声注入 033
2.2.7 鲁棒性 036
2.2.8 数据标注和对齐 040
2.3 特征提取 044
2.3.1 特征的基本概念和作用 044
2.3.2 嵌入 045
2.3.3 词袋模型 046
2.3.4 TF-IDF特征 047
第3章 文本检索 049
3.1 文本检索简介 050
3.1.1 文本检索的相关概念 050
3.1.2 RAG应用中的检索模型 050
3.1.3 传统检索模型 051
3.1.4 现代神经检索模型演进 051
3.2 检索算法分类与实现 052
3.2.1 统计检索算法 052
3.2.2 语义检索算法 056
3.2.3 近似最近邻检索原理与优化 060
3.2.4 Elasticsearch检索 062
3.3 向量化技术 065
3.3.1 向量化技术简介 065
3.3.2 词向量技术 065
3.3.3 上下文感知嵌入 067
3.3.4 文档级向量化策略 070
3.3.5 句子嵌入 072
第4章 文本生成技术与可控输出 074
4.1 生成式模型基础 075
4.1.1 文本生成范式 075
4.1.2 RAG应用中的文本生成 075
4.2 主流生成模型架构 077
4.2.1 RNN/LSTM的序列生成 077
4.2.2 Transformer核心机制 089
4.2.3 预训练语言模型的演进总结 091
4.3 生成控制技术 092
4.3.1 解码策略 092
4.3.2 参数调控 095
4.3.3 约束生成 098
4.3.4 安全与伦理过滤机制 099
4.4 基于本地PDF图书内容的AI问答系统 101
4.4.1 项目介绍 101
4.4.2 准备环境 102
4.4.3 语言模型的集成与优化 104
4.4.4 基于LangChain的多文档检索器 111
4.4.5 系统测试 118
第5章 RAG模型的训练与调优 122
5.1 模型训练流程 123
5.2 核心训练技术 124
5.2.1 预训练与微调 124
5.2.2 多任务学习 127
5.2.3 注意力机制与改进 130
5.2.4 对比学习与负采样优化 132
5.2.5 迁移学习和微调 135
5.2.6 调整动态学习率 137
5.2.7 混合精度训练与分布式训练 140
5.3 基于DeepSeek和RAG的本地知识库系统 142
5.3.1 RAG架构 143
5.3.2 基于本地书籍知识的RAG程序 143
5.3.3 本地知识库系统 149
5.4 微调DeepSeek-R1-Distill-Qwen模型 152
5.4.1 DeepSeek-R1-Distill-Qwen介绍 152
5.4.2 具体实现 153
第6章 模型评估与优化策略 162
6.1 模型评估基础 163
6.1.1 模型评估的必要性 163
6.1.2 常用的评估指标 164
6.2 模型的性能评估 167
6.2.1 单模态模型的性能评估 167
6.2.2 多模态模型融合性能评估 169
6.2.3 效率评估 170
6.2.4 端到端评估指标 172
6.3 模型验证方法论 174
6.3.1 数据准备和分割 174
6.3.2 交叉验证与对抗样本测试 176
6.3.3 模型鲁棒性验证 181
6.4 模型优化技术进阶 183
6.4.1 检索器优化 183
6.4.2 生成器优化 185
6.4.3 系统级优化 186
6.5 基于RAG、GRPO和DeepSeek的问答系统 187
6.5.1 项目介绍 187
6.5.2 准备训练环境 188
6.5.3 加载并配置DeepSeek R1模型 190
6.5.4 初始化向量数据库集合 190
6.5.5 模型评估 191
6.5.6 基于GRPO的RAG 193
6.5.7 基于RAG与GRPO的训练 198
6.5.8 文本嵌入和数据准备 199
6.5.9 主函数 200
第7章 嵌入表示和生成 203
7.1 大模型嵌入基础 204
7.1.1 大模型嵌入介绍 204
7.1.2 大模型嵌入的应用 204
7.2 图像嵌入 205
7.2.1 图像嵌入介绍 205
7.2.2 图像特征提取 206
7.2.3 模态对齐 209
7.2.4 CLIP模型 212
7.2.5 DALL-E模型 213
7.3 文本嵌入 215
7.3.1 大模型中的文本嵌入 215
7.3.2 基于CLIP模型的文本嵌入 217
7.4 音频嵌入 218
7.4.1 音频特征提取 218
7.4.2 常用音频嵌入模型 220
7.5 基于CLIP大模型的图像搜索引擎 223
7.5.1 项目介绍 223
7.5.2 CLIP大模型的配置参数 224
7.5.3 数据集处理 225
7.5.4 实现Bangla CLIP模型 229
7.5.5 基于文本的图像搜索 231
7.5.6 基于Streamlit的Web客户端 232
第8章 动态RAG 235
8.1 动态RAG概述 236
8.1.1 动态RAG与传统RAG的区别 236
8.1.2 动态RAG的适用场景 237
8.2 动态检索模块 238
8.2.1 实时数据流的接入与处理 238
8.2.2 动态索引构建 242
8.2.3 检索结果的实时更新 245
8.3 动态生成模块 248
8.3.1 基于实时上下文的生成 248
8.3.2 动态提示设计 251
8.3.3 多模态生成的动态适配 254
8.3.4 动态生成中的一致性与连贯性 256
8.4 动态RAG的优化技术 257
8.4.1 动态环境中的微调策略 257
8.4.2 在线学习与模型更新 260
8.4.3 动态检索与生成的协同优化 263
8.4.4 动态负载均衡 266
第9章 基于多模型的聊天助手(DeepSeek/ Ollama/ChromaDB/JWT/OpenAI+LangChain) 269
9.1 项目介绍 270
9.2 系统配置 271
9.2.1 配置API密钥 271
9.2.2 Docker配置 273
9.3 后端模块 276
9.3.1 数据库模型 276
9.3.2 大模型服务封装 279
9.3.3 向量数据库的封装与管理 281
9.3.4 文件存储与身份安全封装 284
9.3.5 业务服务与API路由 286
9.3.6 Docker与部署 300
9.3.7 FastAPI主界面 301
9.4 前端模块 301
9.4.1 入口与布局 302
9.4.2 页面模块 305
9.5 调试运行 315
內容試閱
自DeepSeek模型推出以来,迅速在人工智能领域引起了广泛关注和热烈讨论。其创新的架构和卓越的性能使其成为研究者和开发者的热门选择。
随着DeepSeek等大模型技术的快速发展,单纯依靠生成模型完成所有任务的效率与准确性逐渐受到挑战。RAG(retrieval-augmented generation,检索增强生成)技术通过将检索与生成模型有机结合,实现了从大量外部数据中快速检索相关信息,并与生成模型的强大语言理解与表达能力相结合,从而大幅提升了问答系统、聊天机器人、文本生成等应用的性能。相比纯生成模型,RAG在处理实时信息、提供更精准答案以及降低训练和推理成本方面具有显著优势。
本书基于DeepSeek,系统地介绍了RAG技术的基础概念、核心算法与应用实践,并深入探讨了数据预处理、文本检索与生成、模型训练与优化等关键环节。随着大模型与多模态技术的不断演进,掌握RAG技术已成为构建高效智能系统的必要技能。本书不仅为初学者提供了详尽的入门指导,也为开发者与研究人员提供了丰富的高级技术方法与实战案例。
本书的特色
1. 系统全面的内容结构
从基础知识、数据准备、文本检索与生成、模型训练到动态RAG与多模型集成,形成完整的技术链条,帮助读者全方位掌握RAG的核心开发技术。
2. DeepSeek模型RAG实践
本书通过详细的案例分析和实战指导,展示了DeepSeek模型在不同应用场景中的RAG实现,是深入理解和应用DeepSeek模型的宝贵资源。
3. 理论与实战相结合
通过丰富的实战案例,例如书籍问答系统、基于CLIP模型的图像搜索引擎等,详细展示RAG的实际应用流程,让读者能够边学边用,快速积累实践经验。
4. 深入剖析核心技术
重点解析文本检索算法(如BM25、DPR、Elasticsearch)、生成技术(Transformer、
采样方法)、嵌入表示与动态生成优化策略,帮助读者掌握关键算法和实现细节。
5. 关注多模态与跨平台集成
探讨RAG在多模态领域的应用,包括文本、图像、音频等模态的嵌入与搜索,以及多平台模型(如Hugging Face、OpenAI)的集成实践,拓展读者的技术视野。
6. 动态RAG与前沿技术探索
系统介绍了动态检索与生成技术,涵盖实时数据接入、动态负载均衡、在线学习等先进技术,帮助开发者应对动态环境中的复杂业务需求。
7. 面向未来的技术展望
分析RAG的优势与挑战,探讨未来发展方向与技术创新,为读者提供关于行业未来的思考与启发,助力读者在AI领域持续成长。
本书的读者对象
·人工智能开发者与研究人员
·DeepSeek模型爱好者与实践者
·大模型与多模态技术爱好者
·企业技术负责人与架构师
·数据工程师与算法工程师
·高校师生与科研人员
·产品经理与技术决策者
在本书的编写过程中,编者得到了化学工业出版社各位专业编辑的悉心指导与大力支持。正是他们以严谨、耐心和高效的态度,确保了本书能够顺利出版。对此,深表感谢。
同时,衷心感谢家人在整个写作期间给予的巨大支持与理解,他们的陪伴与鼓励是我坚持完成本书的重要动力。
由于编者水平有限,书中难免存在不足之处,恳请广大读者不吝赐教,提出宝贵的意见与建议,以便在后续版本中不断完善与改进。
最后,感谢您选择并阅读本书。希望它能成为您编程与技术探索路上的有力向导,并助您在学习与实践中不断进步!祝您阅读愉快!
编著者

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2026 (香港)大書城有限公司 All Rights Reserved.