重构大数据统计

Author: 杨旭  

Publisher: 电子工业出版社‎

Publication year: 2014

E-ISBN: 9787121225000

P-ISBN(Hardback):  9787121225000

Subject: TP274 数据处理、数据处理系统

Keyword: 数据处理、数据处理系统

Language: CHS

Access to resources Favorite

Disclaimer: Any content in publications that violate the sovereignty, the constitution or regulations of the PRC is not accepted or approved by CNPIEC.

Description

内容简介:对于大数据的统计计算,更注重减少计算资源的使用,提高计算效率。本书提出了一套完整的关于大数据统计的计算理论,包括了常用的各种统计量和统计方法,该理论在作者带领团队开发的大数据统计函数库的实践应用中得到了验证。本书对大数据统计计算的思想、方法和具体步骤进行了详细的文字描述和举例说明;书中包含了数学推导和结果,揭示了各种统计概念和方法其中内在的关联;书中的示例程序代码可以帮助读者进一步了解实现细节,便于读者将书中方法用来进行实际计算。

Chapter

5.2 交叉表

第6章 极限定理

6.1 大数定理

6.2 中心极限定理

第7章 常用的分布函数介绍

7.1 基本定义

7.2 标准正态分布(Z分布或U分布)

7.3 卡方分布(X^2分布)

7.4 学生T分布

7.5 F分布

第8章 常用分布函数计算

8.1 函数定义

8.2 函数性质及相互间的关系

8.3 分布函数关系图

8.4 分布函数的计算

8.4.1 计算Γ(x)

8.4.2 计算CDF_Γ

8.4.3 计算CDF_B

8.4.4 计算IDF_Γ和CDF_B

8.4.5 其他函数的计算

8.5 生成常用分布的随机数

第9章 参数估计

9.1 点估计与区间估计

9.2 单个总体的参数估计

9.2.1 不同情况的参数估计表达式

9.2.2 单个总体参数估计的实现

9.3 两个总体的参数估计

9.3.1 不同情况的参数估计表达式

9.3.2 两个总体参数估计的实现

第10章 假设检验

10.1 基本概念

10.2 参数检验

10.3 单个总体参数的检验

10.3.1 各种情况下的检验方法

10.3.2 单个总体参数检验方法的实现

10.3.3 不同检验方法的选择

10.4 两个总体参数的检验

10.4.1 各种情况下的检验方法

10.4.2 两个总体参数检验方法的实现

10.4.3 不同检验方法的选择

第11章 非参数检验

11.1 Pearson拟合优度X^2检验

11.2 两个变量的列联表检验

11.3 K-S检验

11.3.1 单样本K-S检验

11.3.2 双样本K-S检验

11.4 符号检验

11.5 秩统计量和秩检验方法

11.5.1 Wilcoxon秩和检验

11.5.2 Wilcoxon符号秩和检验

11.5.3 Kruskal-Wallis检验

11.5.4 Friedman检验

第12章 方差分析

12.1 单因素方差分析

12.1.1 计算流程

12.1.2 代码实现

12.1.3 方差分析与T检验的关系

12.1.4 方差分析中的多重比较方法

12.2 双因素方差分析

12.2.1 无交互作用的双因素方差分析

12.2.2 有交互作用的双因素方差分析

第13章 多元线性回归

13.1 数学模型

13.2 显著性检验

13.3 计算步骤

13.4 代码实现

13.5 多重共线性

13.5.1 度量指标

13.5.2 代码实现

13.5.3 应用示例

13.6 逐步回归

第14章 主成分分析

14.1 计算步骤

14.2 代码实现

14.3 应用举例

第15章 判别分析

15.1 距离判别

15.1.1 Mahalanobis距离

15.1.2 模型训练和预测

15.2 Fisher判别

15.3 Bayes判别

15.3.1 朴素Bayes判别

15.3.2 模型训练和预测

15.4 判别算法的综合模型

15.5 应用举例

第16章 模型评估曲线

16.1 相关概念

16.2 定义

16.2.1 ROC曲线

16.2.2 上升图和反馈率—精确率线

16.3 计算实现

参考文献

The users who browse this book also browse