《统计学图鉴》Epub-Pdf-Mobi-Txt-Azw3 下载在线阅读

 《统计学图鉴》Epub-Pdf-Mobi-Txt-Azw3 下载在线阅读

栗原伸一 & 丸山敦史

8.5(28人评价)

 

大量统计图表和手,全面、系地介统计学的基和相公式,解了各种统计方法及其景,并使用R 行了简单实现。内容涉及概率分布、假设检验、置信区、非参数方法和回分析等。全书图文清晰直,基概念、统计方法和分析果皆一目了然,是一本不可多得的统计学入佳作,旨在帮助者了解并统计学基今后的深入学打下基。同,本书还设统计学的”“专栏,趣味性十足。

epubooks.top站是一个下载优质电子书的网站,书籍种类非常多,每个类目下的书籍资源都非常丰富,支持kindle、epub、mobi、azw3、pdf格式下载。以及在线阅读-epub,kindle,mobi,azw3,pdf格式! 一個下載優質電子書的網站,書籍種類非常多,每個類目下的書籍資源都非常豐富,支持kindle、epub、mobi、azw3、pdf格式下載。以及在線閱讀-epub,kindle,mobi,azw3,pdf格式! ======================================================= 记得收藏本站哟!每天都会更新 资源收集不易,还请帮忙点一点,是我的动力谢谢!!!!!!!!!! 如果有什么书本站没有,你也可以在评论处留言。我会第一时间去的! 收藏本站每日更新更多书籍! 资源地址: Epub版-----网盘密码1122 MOBI版-----网盘密码1122 PDF版------网盘密码1122 TxT版------网盘密码1122 azw3版------网盘密码1122 ======================================================= 部分简介:
样本数据和大数据 官方统计或问卷调查中的数据都是样本数据。 分析结果的准确性是通过回归分析或假设检验来判断的。 大数据一般包含关于分析对象的所有信息(全数调查)。例如,某个店铺的 POS 数据包含该店铺所有商品的销售记录。 全数调查的数据不需要进行假设检验。 大数据中的数据量非常丰富,可以分开使用。例如,我们可以分别创建用于构建模型的样本和用于检验的样本,使用实际数据检验预测的精确度。 数据的多样性(variety of data)…除了传统的结构化数据(数值或文字等),大数据中还包含声音和动画等非结构化数据和 XML 等半结构化数据。 11.6 大数据分析②:~关联分析~ 抽取某个事件发生后紧接着发生另一个事件的规则,找出应该注意的内容,这就是关联分析。它适用于分析大规模数据集。 如果使用 POS 系统(Point Of Sale System)的数据(交易数据),我们就可以了解到易于被同时购买的商品组合有哪些。该方法只用来明确关联性(相关关系),并不涉及因果关系。 明天就是周末了。为了提高营业额,该怎样陈列商品呢? 关联分析(association analysis)…关联分析是针对市场营销的数据挖掘方法。找出容易被一起购买的商品,然后将相关商品陈列在旁边的位置,以此来提高营业额。又称购物篮分析。 交易数据的关联性 交易数据(transaction data)…何时卖给谁多少个什么样的商品,以及收款多少等与顾客的交易(transaction)记录。交易数据中比较有名的是 POS 数据。 11.7 大数据分析③:~趋势预测和SNS 分析~ 对市场营销来说,Yahoo !和 Google 等搜索引擎的搜索记录以及 Facebook 和 Twitter 等社交网络软件的数据是非常重要的信息。 搜索的词语数量称为搜索量(search volume)。 通过比较一段时间内的搜索量,或者根据国家或地区来统计搜索量,我们可以了解最新的趋势。 利用搜索量传达的信息,可以提高对营业额、游客数、住宅销售数、住宅价格等的预测精确度。 将现在的趋势反映到预测中 传统的预测模型只根据之前的数据来预测未来。因此,这类模型不能应对急剧变化的情况。 但由于网络搜索量和 SNS 数据等大数据会灵敏反映现在的趋势,所以将它们放入预测模型中后,预测的精确度会得到提升。 趋势预测(trend prediction)…使用统计模型来预测趋势。利用网络搜索量或 SNS 数据可以更加准确地进行预测。比如使用 Google 预测流行性感冒的趋势等。 根据 SNS 数据把握流行趋势 如果使用数据挖掘(明确文本数据中的特点和趋势的方法)来分析 SNS 的文章,我们就可以了解话题变化的趋势,分析对象的语言逻辑等。 从分析行为到确定灾区 如果 SNS 的信息中添加了位置信息,我们就可以掌握游客的行为、嗜好,还能确定灾害发生的位置。  SNS 数据拥有庞大的信息量且具备即时性,但它不是万能的。SNS 用户不能 代表所有人,噪声(文意不明的评论)的处理也是一项难度较大的工作。为了看清 SNS 数据的本质,我们需要充分理解数据的特性,自身也要具备较高的分析能力。 SNS 分析(social media analytics)…传统问卷调查中的询问内容对回答有很大影响,而 SNS 分析不会出现这种情况。另外,通过 SNS 分析,我们甚至可以掌握消费者的心声。 附录 A R 的安装和使用方法 统计软件 R R 是由奥克兰大学的研究人员编写的统计软件。 该软件可免费使用,全球的研究人员和学生都在使用该软件。 包中汇集了 R 的函数,我们可根据需要将其读入 R 中。 R 相关的图书和网站有很多,非常适合用来自学。 不过,该软件要求输入字符命令,这一点可能需要我们花时间来适应。 下载 R 启动浏览器,在搜索引擎中输入 The Comprehensive R Archive Network,并进入 R 的下载主页。在右图所示的页面中,点击与自己的计算机的操作系统相匹配的选项。(这里以“Download R for Windows”为例。) 这时会显示右图所示的页面。点击“base”。 然后会显示右图所示的页面。点击“Download R*.*.* for windows”。(*.*.* 的部分表示 R 的版本。请下载最新版本。) 安装 R 下载 R-*.*.*-win.exe 文件后,运行(双击)该文件。(*.*.* 的部分表示 R 的版本。) 选择安装时使用的语言,进入安装页面。 点击“下一步”,继续安装。 在使用默认设置完成安装后,桌面上会出现图标(在操作系统是 32 位的情况下只有左边的图标,64 位的情况下有两个图标)。 双击该图标,启动 R。 启动 R 双击图标后,页面上会出现右图所示的窗口。该窗口叫作“R Console”窗口。 输入 R 命令 在“R Console”窗口的“”后面输入 R 命令后,按“Enter”键执行,或者使用“R Editor”编写一连串命令,然后执行。 在“File”菜单中选择“New script”来启动“R Editor”。 可以保存脚本(写有 R 命令的文件),以便下次分析时使用。 创建数据文件(Excel) R 中可以读取各种形式的数据文件,但最常用的还是 CSV 格式的文件。我们可以使用 Excel 等软件将文件类型修改为 CSV。 读取数据文件 我们可以使用命令 read.csv。 如果使用 R Editor,请在输入命令之后,将光标置于该行,同时按下 Ctrl 键和 R 键。 要想获取文件路径,我们需要使用文件资源管理器来选择想读取的数据文件(CSV 格式),然后点击“主页”选项卡中的“复制路径”。这样路径就被复制了,我们可以把它粘贴到命令行中使用。 安装包 首次使用需要先下载包,并将其安装到 R 中。先指定下载的网站。请在“Packages”菜单中选择“Set CRAN mirror...”。 在右图所示的弹出窗口中选择“China(Shanghai)”。 选择“Packages”菜单中的“Install package(s)...”。 在右图所示的弹出窗口中选择想要安装的包。 为了在 R 中使用安装的包,我们需要在 R 控制台中输入 >library(survival),或者在 R Editor(脚本)中进行记述。 附录 B 统计数值表(分布表)、正交表、希腊字母 1 标准正态()分布表(右侧概率) 2  分布表(右侧概率) 3 卡方分布表(右侧概率) 4-1  分布表(右侧概率为 5%) 4-2  分布表(右侧概率为 2.5%) 5 学生化极差分布的 值表(右侧概率为 5%) 6 曼-惠特尼 检验表(双侧概率为 5% 和 1%) 7 用于符号检验的概率为 1/2 的二项分布表(左侧概率) 8 威尔科克森符号秩检验表 9 Kruskal-Wallis 检验表(3 组和 4 组) 10 Friedman 检验表(3 组和 4 组) 11-1 正交表(2 水平型) 11-2 正交表(3 水平型) 11-3 正交表(混合型) 12 希腊字母 1 标准正态(z)分布表(右侧概率) 注:表中的数值表示标准正态分布的右侧概率。左表头表示 值的个位和小数点后第 1 位,上表头表示小数点后第 2 位。例如, 值为 1.96 的右侧(单侧)概率是 1.9 所在的行与 0.06 所在的列交叉处的 0.025(2.5%)(灰色底纹处的值)。 2 t 分布表(右侧概率) 注:与标准正态分布表不同,该表中的值是 值。其中, 表示自由度。例如,右侧概率为 2.5%(0.025)的 值在自由度为 10 时是 2.228。最常用的是灰色底纹处的双侧概率为 5% 的那一列。 3 卡方分布表(右侧概率) 注:与 分布一样,表中的值是卡方值, 表示自由度。用灰色底纹标注的列是独立性检验中常用的右侧概率为 5% 的列,以及总体方差的区间估计(使用双侧概率)中常用的右侧概率为 2.5%、97.5% 的列。

发表评论

0 评论