推荐编程书籍:Python统计分析,由人民邮电出版社2018-12-01月出版发行,本书编译以及作者信息 为:[奥地利] 托马斯·哈斯尔万特(Thomas Haslwanter) 著,李锐 译,此次为第1次发行, 国际标准书号为:9787115493842,品牌为异步图书, 这本书采用平装开本为小16开,纸张采为胶版纸,全书共有224页字数万字,是本Python 编程相关非常不错的书。
本书以基础的统计学知识和假设检验为重点,简明扼要地讲述了Python在数据分析、可视化和统计建模中的应用。主要包括Python的简单介绍、研究设计、数据管理、概率分布、不同数据类型的假设检验、广义线性模型、生存分析和贝叶斯统计学等从入门到高级的内容。
本书利用Python这门开源语言,不仅在直观上对数据分析和统计检验提供了很好的理解,而且在相关数学公式的讲解上也能够做到深入浅出。本书的可操作性很强,配套提供相关的代码和数据,读者可以依照书中所讲,复现和加深对相关知识的理解。
本书适合对统计学和Python有兴趣的读者,特别是在实验学科中需要利用Python的强大功能来进行数据处理和统计分析的学生和研究人员。
作者简介
托马斯·哈斯尔万特(Thomas Haslwanter)在学术机构中有超过10年的教学经验,是林茨上奥地利州应用大学(University of Applied Sciences Upper Austria in Linz)医学工程系的教授,瑞士苏黎世联邦理工学院讲师,并曾在澳大利亚悉尼大学和德国图宾根大学担任过研究员。他在医学研究方面经验丰富,专注于眩晕症的诊断、治疗和康复。在深入使用Matlab十五年后,他发现Python非常强大,并将其用于统计数据分析、声音和图像处理以及生物仿真应用。
译者简介
李锐,复旦大学公共卫生学院流行病与生物统计专业博士生,Python、R和Lisp语言的爱好者,主要研究方向为统计学习和机器学习建模以及组学数据的数据挖掘。先后以**作者身份发表学术论文6篇,其中SCI论文4篇。参编中文专著2本。
审校者简介
张志杰,复旦大学公共卫生学院副教授,多本国际医疗卫生期刊的特邀编辑,研究方向为统计建模和医学领域的统计分析方法。参与并完成国家重大科技专项、“863”、国家“十五”科技攻关课题、自然基金重大项目等多项***课题的研究,研究成果先后获2010年全国百篇优秀博士学位论文、2012年上海市医学奖二等奖、上海市科技进步奖二等奖以及中华医学奖三等奖,2011年入选复旦大学首批“卓学人才计划”,2013年入选上海市第二批新优青人才计划。
近年来Python生态系统不断完善,Python这门语言已经成为计算的流行语言,它为统计数据分析提供了强大的操作环境。
本书主要介绍了Python在统计数据分析中的应用,内容涵盖连续、离散和分类数据的常见统计检验,以及线性回归分析、生存分析和贝叶斯统计等主题。
本书的特色:针对每种检验方法,提供了Python解决方案的代码和数据,以及便于实际操作的Python示例。借此,读者可以重现这些问题并加强他们对这些统计分析方法的理解。本书所用数据主要来自生命和医学,因此对这些领域的学生可能更有针对性。不过,本书也介绍了Python的基础知识以及一些统计学的基础知识,任何想要进行统计数据分析的人都可以阅读本书。
第 一部分Python和统计学
第 1章为什么学习统计学2
第 2章Python4
2.1开始4
2.1.1惯例4
2.1.2发行版和包5
2.1.3安装Python7
2.1.4安装R和rpy28
2.1.5个性化IPython/Jupyter9
2.1.6Python资源12
2.1.7第 一个Python程序13
2.2Python数据结构14
2.2.1Python数据类型14
2.2.2索引和切片16
2.2.3向量和数组17
2.3IPython/Jupyter:一个交互式的Python编程环境18
2.3.1Qt控制台的第 一个会话19
2.3.2Notebook和rpy221
2.3.3IPython小贴士23
2.4开发Python程序24
2.4.1将交互式命令转化为一个Python程序24
2.4.2函数、模块和包26
2.4.3Python小贴士30
2.4.4代码版本控制31
2.5Pandas:用于统计学的数据结构31
2.5.1数据处理31
2.5.2分组(Grouping)33
2.6Statsmodels:统计建模的工具34
2.7Seaborn:数据可视化35
2.8一般惯例36
2.9练习36
第3章数据输入38
3.1从文本文件中输入38
3.1.1目视检查38
3.1.2读入ASCII数据到Python中38
3.2从MS Excel中导入42
3.3从其他格式导入数据43
第4章统计数据的展示45
4.1数据类型45
4.1.1分类数据45
4.1.2数值型46
4.2在Python中作图46
4.2.1函数式和面向对象式的绘图方法47
4.2.2交互式绘图48
4.3展示统计学数据集52
4.3.1单变量数据53
4.3.2二元变量和多元变量绘图59
4.4练习61
第二部分分布和假设检验
第5章背景63
5.1总体和样本63
5.2概率分布64
5.2.1离散分布64
5.2.2连续分布65
5.2.3期望值和方差65
5.3自由度66
5.4研究设计66
5.4.1术语67
5.4.2概述67
5.4.3研究类型68
5.4.4实验设计69
5.4.5个人建议72
5.4.6临床研究计划73
第6章单变量的分布74
6.1分布的特征描述74
6.1.1分布中心74
6.1.2量化变异度76
6.1.3分布形状的参数描述79
6.1.4概率密度的重要展示81
6.2离散分布82
6.2.1伯努利分布82
6.2.2二项分布83
6.2.3泊松分布85
6.3正态分布86
6.3.1正态分布的例子88
6.3.2中心极限定理88
6.3.3分布和假设检验89
6.4来自正态分布的连续型分布90
6.4.1t分布90
6.4.2卡方分布92
6.4.3F分布94
6.5其他连续型分布95
6.5.1对数正态分布96
6.5.2韦伯分布96
6.5.3指数分布97
6.5.4均匀分布98
6.6练习98
第7章假设检验100
7.1典型分析步骤100
7.1.1数据筛选和离群值100
7.1.2正态性检验101
7.1.3转换104
7.2假设概念、错误、p值和样本量104
7.2.1一个例子104
7.2.2推广和应用105
7.2.3p值的解释106
7.2.4错误的类型107
7.2.5样本量108
7.3灵敏度和特异度110
7.4受试者操作特征(ROC)曲线113
第8章数值型数据的均值检验114
8.1样本均值的分布114
8.1.1单样本均值的t检验114
8.1.2Wilcoxon符号秩和检验116
8.2两组之间的比较117
8.2.1配对t检验117
8.2.2独立组别之间的t检验118
8.2.3两组之间的非参数比较:Mann-Whitney检验118
8.2.4统计学假设检验与统计学建模118
8.3多组比较120
8.3.1方差分析(ANOVA)120
8.3.2多重比较123
8.3.3Kruskal–Wallis检验125
8.3.4两因素方差分析126
8.3.5三因素方差分析126
8.4总结:选择正确的检验方法进行组间比较127
8.4.1典型的检验127
8.4.2假设的例子128
8.5练习129
第9章分类数据的检验131
9.1单个率131
9.1.1置信区间131
9.1.2解释132
9.1.3例子132
9.2频数表133
9.2.1单因素卡方检验133
9.2.2卡方列联表检验134
9.2.3Fisher精确检验136
9.2.4McNemar检验139
9.2.5Cochran’s Q检验140
9.3练习141
第 10章生存时间分析144
10.1生存分布144
10.2生存概率145
10.2.1删失145
10.2.2Kaplan–Meier生存曲线146
10.3在两组间比较生存曲线148
第三部分统计建模
第 11章线性回归模型150
11.1线性相关150
11.1.1相关系数150
11.1.2秩相关151
11.2一般线性回归模型152
11.2.1例子1:简单线性回归153
11.2.2例子2:二次方拟合153
11.2.3决定系数154
11.3Patsy:公式的语言155
11.4用Python进行线性回归分析158
11.4.1例子1:拟合带置信区间的直线158
11.4.2例子2:嘈杂的二次多项式159
11.5线性回归模型的结果162
11.5.1例子:英国的烟草和酒精162
11.5.2带有截距的回归的定义165
11.5.3R2值165
11.5.4调整后的R2值165
11.5.5模型的系数和它们的解释168
11.5.6残差分析171
11.5.7异常值174
11.5.8用Sklearn进行回归175
11.5.9结论176
11.6线性回归模型的假设177
11.7线性回归模型结果的解释180
11.8Bootstrapping180
11.9练习181
第 12章多元数据分析182
12.1可视化多元相关182
12.1.1散点图矩阵182
12.1.2相关性矩阵182
12.2多重线性回归184
第 13章离散数据的检验185
13.1等级资料的组间比较185
13.2Logistic回归186
13.3广义线性模型188
13.3.1指数族分布189
13.3.2线性预测器和连接函数189
13.4有序Logistic回归189
13.4.1问题定义189
13.4.2优化191
13.4.3代码191
13.4.4性能191
第 14章贝叶斯统计学193
14.1贝叶斯学派与频率学派的解释193
14.2计算机时代的贝叶斯方法195
14.3例子:用马尔可夫链蒙特卡洛模拟分析挑战者号灾难195
14.4总结198
参考答案199
术语表219
参考文献223
暂无.
暂无.
暂无.
Python统计分析最新最全的试读、书评、目录、简介信息由Python中文网整理提供。
本文链接:http://so.lmcjl.com/news/19846/