面向数据科学家的实用统计学 (美)彼得·布鲁斯(Peter Bruce),(美)安德鲁·布鲁【无忧售后 正版书籍】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线

面向数据科学家的实用统计学 (美)彼得·布鲁斯(Peter Bruce),(美)安德鲁·布鲁【无忧售后 正版书籍】精美图片
》面向数据科学家的实用统计学 (美)彼得·布鲁斯(Peter Bruce),(美)安德鲁·布鲁【无忧售后 正版书籍】电子书籍版权问题 请点击这里查看《

面向数据科学家的实用统计学 (美)彼得·布鲁斯(Peter Bruce),(美)安德鲁·布鲁【无忧售后 正版书籍】书籍详细信息

  • ISBN:9787115493668
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2018-10
  • 页数:220页
  • 价格:20.69
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分
  • 豆瓣短评:点击查看
  • 豆瓣讨论:点击查看
  • 豆瓣目录:点击查看
  • 读书笔记:点击查看
  • 原文摘录:点击查看
  • 更新时间:2025-01-20 21:31:10

内容简介:

本书解释了数据科学中至关重要的统计学概念,介绍如何将各种统计方法应用于数据科学。作者以易于理解、浏览和参考的方式,引出统计学中与数据科学相关的关键概念;解释各统计学概念在数据科学中的重要性及有用程度,并给出原因。


书籍目录:

  

前言ii

章探索性数据分析1

1.1结构化数据的组成2

1.2矩形数据4

1.2.1数据框和索引5

1.2.2非矩形数据结构5

1.2.3拓展阅读6

1.3位置估计6

1.3.1均值7

1.3.2中位数和稳健估计量8

1.3.3位置估计的例子:人口和谋杀率9

1.3.4拓展阅读10

1.4变异性估计10

1.4.1标准偏差及相关估计值11

1.4.2基于百分位数的估计量13

1.4.3例子:美国各州人口的变异性估计量14

1.4.4拓展阅读14

1.5探索数据分布14

1.5.1百分位数和箱线图15

1.5.2频数表和直方图16

1.5.3密度估计18

1.5.4拓展阅读20

1.6探索二元数据和分类数据20

1.6.1众数21

1.6.2期望值22

1.6.3拓展阅读22

1.7相关性22

1.7.1散点图25

1.7.2拓展阅读26

1.8探索两个及以上变量26

1.8.1六边形图和等势线(适用于两个数值型变量)26

1.8.2两个分类变量28

1.8.3分类数据和数值型数据29

1.8.4多个变量的可视化31

1.8.5拓展阅读33

1.9小结33

第2章数据和抽样分布34

2.1抽样和样本偏差35

2.1.1偏差36

2.1.2选择37

2.1.3数据规模与数据质量:何时规模更重要38

2.1.4样本均值与总体均值38

2.1.5拓展阅读39

2.2选择偏差39

2.2.1趋均值回归40

2.2.2拓展阅读41

2.3统计量的抽样分布42

2.3.1中心极限定理44

2.3.2标准误差44

2.3.3拓展阅读45

2.4自助法45

2.4.1重抽样与自助法47

2.4.2拓展阅读48

2.5置信区间48

2.6正态分布50

2.7长尾分布53

2.8学生t分布55

2.9二项分布57

2.10泊松分布及其相关分布58

2.10.1泊松分布59

2.10.2指数分布59

2.10.3故障率估计60

2.10.4韦伯分布60

2.10.5拓展阅读61

2.11小结61

第3章统计实验与显著性检验62

3.1A/B测试62

3.1.1为什么要有对照组64

3.1.2为什么只有处理A和B,没有C、D……65

3.1.3拓展阅读66

3.2假设检验66

3.2.1零假设67

3.2.2备择假设67

3.2.3单向假设检验和双向假设检验68

3.2.4拓展阅读68

3.3重抽样68

3.3.1置换检验69

3.3.2例子:Web黏性69

3.3.3穷尽置换检验和自助置换检验72

3.3.4置换检验:数据科学的底线72

3.3.5拓展阅读72

3.4统计显著性和p值72

3.4.1p值74

3.4.2α值75

3.4.3类错误和第二类错误76

3.4.4数据科学与p值76

3.4.5拓展阅读77

3.5t检验77

3.6多重检验78

3.7自由度81

3.8方差分析82

3.8.1F统计量84

3.8.2双向方差分析85

3.8.3拓展阅读86

3.9卡方检验86

3.9.1卡方检验:一种重抽样方法86

3.9.2卡方检验:统计理论88

3.9.3费舍尔检验88

3.9.4与数据科学的关联90

3.9.5拓展阅读91

3.10多臂老虎机算法91

3.11检验效能和样本规模93

3.11.1样本规模95

3.11.2拓展阅读96

3.12小结96

第4章回归与预测97

4.1简单线性回归97

4.1.1回归方程98

4.1.2拟合值与残差100

4.1.3最小二乘法101

4.1.4预测与解释(剖析)102

4.1.5拓展阅读103

4.2多元线性回归103

4.2.1美国金县房屋数据案例103

4.2.2评估模型104

4.2.3交叉验证106

4.2.4模型选择和逐步回归法107

4.2.5加权回归108

4.3使用回归做预测109

4.3.1外推法的风险109

4.3.2置信区间和预测区间110

4.4回归中的因子变量111

4.4.1虚拟变量的表示112

4.4.2多层因子变量113

4.4.3有序因子变量114

4.5解释回归方程115

4.5.1相关的预测变量116

4.5.2多重共线性117

4.5.3混淆变量117

4.5.4交互作用和主效应118

4.6检验假设:回归诊断119

4.6.1离群值120

4.6.2强影响值121

4.6.3异方差性、非正态分布和相关误差123

4.6.4偏残差图和非线性126

4.7多项式回归和样条回归127

4.7.1多项式回归128

4.7.2样条回归129

4.7.3广义加性模型131

4.7.4拓展阅读132

4.8小结133

第5章分类134

5.1朴素贝叶斯算法135

5.1.1准确的贝叶斯分类是不切实际的136

5.1.2朴素解决方案136

5.1.3数值型预测变量138

5.1.4拓展阅读138

5.2判别分析138

5.2.1协方差矩阵139

5.2.2费希尔线性判别分析139

5.2.3一个简单的例子140

5.2.4拓展阅读142

5.3逻辑回归142

5.3.1逻辑响应函数和Logit函数143

5.3.2逻辑回归和广义线性模型144

5.3.3广义线性模型145

5.3.4逻辑回归的预测值145

5.3.5解释系数和优势比146

5.3.6线性回归与逻辑回归:相似之处和不同之处147

5.3.7模型评估148

5.3.8拓展阅读150

5.4评估分类模型150

5.4.1混淆矩阵151

5.4.2稀有类问题152

5.4.3准确率、召回率和特异性153

5.4.4ROC曲线153

5.4.5AUC155

5.4.6提升156

5.4.7拓展阅读157

5.5不平衡数据的处理策略157

5.5.1欠采样158

5.5.2过采样以及上权重和下权重158

5.5.3数据生成159

5.5.4基于代价的分类160

5.5.5探索预测值160

5.5.6拓展阅读161

5.6小结161

第6章统计机器学习162

6.1K最近邻算法163

6.1.1预测贷款拖欠的示例164

6.1.2距离度量165

6.1.3独热编码166

6.1.4标准化166

6.1.5K值的选取168

6.1.6KNN作为特征引擎169

6.2树模型170

6.2.1一个简单的例子171

6.2.2递归分区算法172

6.2.3测量同质性或不纯度174

6.2.4阻止树模型继续生长175

6.2.5预测连续值176

6.2.6如何使用树模型176

6.2.7拓展阅读177

6.3Bagging和森林177

6.3.1Bagging方法178

6.3.2森林178

6.3.3变量的重要性181

6.3.4超参数183

6.4Boosting184

6.4.1Boosting算法184

6.4.2XGBoost软件185

6.4.3正则化:避免过拟合186

6.4.4超参数和交叉验证189

6.5小结191

第7章无监督学习192

7.1主成分分析193

7.1.1一个简单的例子194

7.1.2计算主成分195

7.1.3解释主成分196

7.1.4拓展阅读198

7.2K-Means聚类198

7.2.1一个简单的例子199

7.2.2K-Means算法201

7.2.3解释类201

7.2.4选择类的个数203

7.3层次聚类204

7.3.1一个简单的例子205

7.3.2树状图205

7.3.3凝聚算法206

7.3.4测量相异性207

7.4基于模型的聚类208

7.4.1多元正态分布209

7.4.2混合正态分布210

7.4.3类数的选取212

7.4.4拓展阅读213

7.5变量的缩放和分类变量213

7.5.1变量的缩放214

7.5.2控制变量215

7.5.3分类数据和高氏距离216

7.5.4混合数据的聚类问题218

7.6小结219

作者简介220

封面说明220


作者介绍:

  

彼得·布鲁斯(Peter Bruce),知名统计学家,Statistics.统计学教育学院的创立者兼院长,重采样统计软件的开发者。曾在美国马里兰大学和各种短训班教授重采样统计课程。

安德鲁·布鲁斯(Andrew Bruce),华盛顿大学统计学博士,拥有30多年的统计学和数据科学经验,在多家知名学术期刊上发表过多篇论文。


出版社信息:

暂无出版社相关信息,正在全力查找中!


书籍摘录:

暂无相关书籍摘录,正在全力查找中!



原文赏析:

暂无原文赏析,正在全力查找中!


其它内容:

书籍介绍

本书解释了数据科学中至关重要的统计学概念,介绍如何将各种统计方法应用于数据科学。作者以易于理解、浏览和参考的方式,引出统计学中与数据科学相关的关键概念;解释各统计学概念在数据科学中的重要性及有用程度,并给出原因。


书籍真实打分

  • 故事情节:5分

  • 人物塑造:7分

  • 主题深度:9分

  • 文字风格:3分

  • 语言运用:8分

  • 文笔流畅:5分

  • 思想传递:9分

  • 知识深度:7分

  • 知识广度:6分

  • 实用性:6分

  • 章节划分:9分

  • 结构布局:5分

  • 新颖与独特:5分

  • 情感共鸣:6分

  • 引人入胜:5分

  • 现实相关:9分

  • 沉浸感:6分

  • 事实准确性:9分

  • 文化贡献:9分


网站评分

  • 书籍多样性:6分

  • 书籍信息完全性:7分

  • 网站更新速度:9分

  • 使用便利性:6分

  • 书籍清晰度:6分

  • 书籍格式兼容性:5分

  • 是否包含广告:4分

  • 加载速度:5分

  • 安全性:7分

  • 稳定性:5分

  • 搜索功能:4分

  • 下载便捷性:8分


下载点评

  • 体验满分(150+)
  • pdf(541+)
  • 无盗版(374+)
  • 图文清晰(170+)
  • 目录完整(387+)
  • 排版满分(524+)
  • 书籍多(248+)
  • epub(183+)
  • 推荐购买(135+)
  • 好评(273+)
  • txt(259+)

下载评价

  • 网友 后***之: ( 2025-01-15 10:09:36 )

    强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!

  • 网友 潘***丽: ( 2025-01-09 10:57:10 )

    这里能在线转化,直接选择一款就可以了,用他这个转很方便的

  • 网友 苍***如: ( 2025-01-04 12:48:58 )

    什么格式都有的呀。

  • 网友 陈***秋: ( 2024-12-28 13:01:14 )

    不错,图文清晰,无错版,可以入手。

  • 网友 宫***玉: ( 2024-12-24 09:47:07 )

    我说完了。

  • 网友 仰***兰: ( 2025-01-14 21:22:09 )

    喜欢!很棒!!超级推荐!

  • 网友 濮***彤: ( 2025-01-07 09:58:12 )

    好棒啊!图书很全

  • 网友 车***波: ( 2024-12-22 02:44:59 )

    很好,下载出来的内容没有乱码。

  • 网友 益***琴: ( 2025-01-17 21:40:11 )

    好书都要花钱,如果要学习,建议买实体书;如果只是娱乐,看看这个网站,对你来说,是很好的选择。

  • 网友 沈***松: ( 2025-01-05 22:50:50 )

    挺好的,不错

  • 网友 曾***玉: ( 2025-01-09 14:46:36 )

    直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!

  • 网友 林***艳: ( 2025-01-13 10:18:04 )

    很好,能找到很多平常找不到的书。

  • 网友 常***翠: ( 2024-12-29 13:12:30 )

    哈哈哈哈哈哈


随机推荐