登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

2023年02月出版新書

『簡體書』特征工程的艺术:通用技巧与实用案例

書城自編碼: 3754229
分類: 簡體書→大陸圖書→計算機/網絡圖形圖像/多媒體
作者: [加拿大]巴勃罗·迪布[Pablo Duboue]
國際書號(ISBN): 9787115588418
出版社: 人民邮电出版社
出版日期: 2022-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 521

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
深度营销:成就营销领导力的12大原则(麦肯锡年度经管好书,12大原则揭秘营销本质,带好团队就是从领导力到影响力!)
《 深度营销:成就营销领导力的12大原则(麦肯锡年度经管好书,12大原则揭秘营销本质,带好团队就是从领导力到影响力!) 》

售價:NT$ 325.0
新质生产力:发展新动能
《 新质生产力:发展新动能 》

售價:NT$ 493.0
状态比能力更重要:108个状态调整法
《 状态比能力更重要:108个状态调整法 》

售價:NT$ 308.0
中国上市公司担保行为的影响因素及其效应研究
《 中国上市公司担保行为的影响因素及其效应研究 》

售價:NT$ 202.0
企业级数据架构:核心要素、架构模型、数据管理与平台搭建    李杨
《 企业级数据架构:核心要素、架构模型、数据管理与平台搭建 李杨 》

售價:NT$ 554.0
政和元年:宋辽金夏的国运博弈与谍战风云
《 政和元年:宋辽金夏的国运博弈与谍战风云 》

售價:NT$ 381.0
黄金圈法则
《 黄金圈法则 》

售價:NT$ 437.0
全球治理理论:权威、合法性与论争
《 全球治理理论:权威、合法性与论争 》

售價:NT$ 549.0

編輯推薦:
为改善机器学习模型的表现,你会花多少时间修改输入数据的特征?图灵奖得主Yoshua Bengio曾说:“好的输入特征是机器学习取得成功的基本条件。在产业化机器学习中,特征工程所占的工作量接近90%。”修改数据特征以更好地捕获问题的本质,这是机器学习的重中之重。没有高深的领域知识能否进行高质量的特征工程?本书直面这一充满争议的话题,在不考虑领域知识的情况下,给出了特征工程的一些通用技巧。此外,本书还展示了丰富的案例,涵盖图数据、时间戳数据、文本数据和图像数据。你将在学习各种技巧和诀窍的过程中,逐渐领会特征工程的艺术。
內容簡介:
特征工程可以修改数据特征,更好地捕获问题本质,从而改进结果。这个过程既是一种艺术,也是技巧和诀窍的一种结合。本书是一本特征工程实用指南,主要探讨如何利用特征工程提升机器学习解决方案的性能。本书从特征工程的基本概念和技术开始介绍,建立了一种特殊的跨领域方法,通过充分研究案例详细介绍了图数据、时间戳数据、文本数据和图像数据的处理方法,包括分箱、折外估计、特征选择、数据降维和可变长度数据编码等重要主题。
關於作者:
巴勃罗·迪布(Pablo Duboue)NLP学者。2005年博士毕业于美国哥伦比亚大学,师从ACL前主席Kathleen McKeown教授,曾是IBM Watson DeepQA团队成员。2016年创办NLP技术公司Textualization。他有丰富的教学经验,是世界多所大学的访问教授。
目錄
第 一部分 基础知识第 1章 简介  21.1 特征工程  41.2 模型评价  81.2.1 度量  81.2.2 交叉验证  101.2.3 过拟合  111.2.4 维数灾难  121.3 周期  121.3.1 ML周期  131.3.2 特征工程周期  151.4 分析  171.4.1 探索性数据分析  171.4.2 误差分析  181.5 其他过程  201.5.1 领域建模  201.5.2 特征构建  221.6 讨论  241.7 扩展学习  26第 2章 特征组合:归一化、离散化和异常值  282.1 归一化特征  292.1.1 标准化和去相关性  312.1.2 平滑  332.1.3 特征加权  342.2 离散化和分箱  352.2.1 无监督离散化  362.2.2 监督离散化  382.3 描述性特征  412.3.1 直方图  412.3.2 其他描述性特征  432.4 处理异常值  442.5 高级技术  462.6 扩展学习  47第3章 特征扩展:可计算特征、填充与核技巧  483.1 可计算特征  493.2 填充  543.3 复杂特征分解  573.4 核操作特征扩展  593.5 扩展学习  62第4章 特征缩减:特征选择、降维和嵌入  644.1 特征选择  654.1.1 度量  664.1.2 组成特征集:搜索与筛选  734.1.3 高级技术  754.2 正则化与嵌入式特征选择  774.2.1 L2 正则化:岭回归  784.2.2 L1 正则化:LASSO  784.2.3 其他使用嵌入式特征选择的算法  794.3 数据降维  804.3.1 特征哈希  814.3.2 随机投影  824.3.3 奇异值分解  824.3.4 隐狄利克雷分配  834.3.5 聚类  844.3.6 其他数据降维技术  854.3.7 嵌入  864.4 扩展学习  90第5章 高级主题:可变长度数据与自动特征工程  915.1 可变长度特征向量  915.1.1 集合  915.1.2 列表  925.1.3 树  945.1.4 图  965.1.5 时间序列  975.2 基于实例的特征工程  1005.3 深度学习与特征工程  1025.4 自动特征工程  1055.4.1 特征学习  1055.4.2 无监督特征工程  1085.5 扩展学习  109第二部分 案例研究第6章 图数据  1136.0 本章概述  1156.1 WikiCities数据集  1166.2 探索性数据分析  1176.3 第 一个特征集  1246.4 第二个特征集  1306.5 终的特征集  1316.6 扩展学习  133第7章 时间戳数据  1347.0 本章概述  1357.1 WikiCities:历史特征  1377.2 时间延迟特征  1397.2.1 填充时间戳数据  1397.2.2 第 一次特征化:填充二阶延迟数据  1407.2.3 误差分析  1417.3 滑动窗口  1427.4 第三次特征化:EMA  1437.5 使用历史数据进行扩展  1437.5.1 第四次特征化:扩展的数据  1447.6 时间序列  1457.6.1 WikiCountries数据集  1457.6.2 探索性数据分析  1467.6.3 第 一次特征化:无TS特征  1497.6.5 使用模型预测作为特征  1497.6.6 讨论  1507.7 扩展学习  151第8章 文本数据  1538.0 本章概述  1558.1 WikiCities:文本  1568.2 探索性数据分析  1568.3 仅数值型记号  1598.3.1 词类型与记号  1608.3.2 分词:基础知识  1608.3.3 第 一次特征化  1618.4 词袋  1628.4.1 分词  1628.4.2 第二次特征化  1638.5 停用词和形态学特征  1658.5.1 停用词  1658.5.2 分词:词干提取  1668.5.3 第三次特征化  1668.6 上下文特征  1678.6.1 二元词  1688.6.2 第四次特征化  1698.7 跳跃二元词与特征哈希  1698.7.1 跳跃二元词  1698.7.2 第五次特征化  1698.8 数据降维与嵌入  1708.8.1 嵌入  1708.8.2 特征加权:TF-IDF  1718.8.3 第六次特征化  1728.9 结束语  1728.9.1 内容扩展  1748.9.2 文本中的结构  1748.10 扩展学习  174第9章 图像数据  1759.0 本章概述  1769.1 WikiCities:卫星图像  1779.2 探索性数据分析  1789.3 像素即特征  1799.3.1 第 一次特征化  1799.3.2 可计算特征:高斯模糊  1809.3.3 白化  1829.3.4 对变动的误差分析  1839.4 自动数据集扩展  1839.4.1 仿射变换  1849.4.2 第二次特征化  1849.5 描述性特征:直方图  1849.6 局部特征检测器:角点  1859.6.1 Harris角点检测  1869.6.2 第四次特征化  1869.7 数据降维:HOG  1879.8 结束语  1899.9 扩展学习  191第 10章 其他领域:视频、GIS和偏好  19210.1 视频  19310.1.1 数据:屏幕录制  19410.1.2 关键帧检测  19410.1.3 目标跟踪:均值漂移  19510.1.4 扩展学习  19710.2 地理特征  19710.3 偏好  19910.3.1 数据:Linux核心代码提交  20010.3.2 填充偏好数据  20110.3.3 扩展学习  202

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.