首页云计算【数据分析】统计学基础及Python具体实现

【数据分析】统计学基础及Python具体实现

时间2024-07-23 01:49:56发布ongwu分类云计算浏览84

各位大佬好 ,这里是阿川的博客,祝您变得更强

个人主页在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力

阿川水平有限,如有错误,欢迎大佬指正

Python 初阶 Python–语言基础与由来介绍 Python–注意事项 Python–语句与众所周知 数据清洗前 基本技能 数据分析—技术栈和开发环境搭建 数据分析—Numpy和Pandas库基本用法及实例 统计学基础前 必看 数据分析—三前奏:获取/ 读取/ 评估数据 数据分析—数据清洗操作及众所周知 数据分析—数据整理操作及众所周知

数据分析统计学不可分割

统计学概述

统计主要是描述和推断

描述

分类数据 有限数量的类别数据 定序顺序的 例如金银铜三枚奖牌,金大于大于定类 例如猫的种类,不能说有顺序

数值数据可进行数学运算和统计分析计算有意义数据 连续 例如1~2之间区间有很多连续的数字 离散 只能以整数或自然数为单位数据

数值数据分析维度

数值数据数据分析的重点,分析维度主要从三个方面分析

集中趋势 数据集中分布在哪里

mean平均数

median中位数

mode众数

离散趋势 数据偏离中心分布在哪里

max-min极差

var/std 方差/标准

quantile(0.75)- quantile(0.25)四分位距

四分位距是将数据按顺序,按四等分分好并排序,处于三个分割点位置的数值就是四分位数-表示中间一半数值的离散程度 越大说明数据分散越小说明数据集中

分布形状

可以看出数据偏态、峰度、异常值分布形状主要是指直方图 plot 表示画图 kind参数具体什么形状 hist表示直方图

偏态解释

直方图一般为正态分布(平均值、中位数、众数差不多都位于中央

偏态(平均数、中位数、众数偏离中央

正偏态即右偏态

负偏态及左偏态

注意一下直方图

数据量小,分布形状较不明显数据量大,分布形状较明显

好的,到此为止啦,祝您变得更强

想说的话

实不相瞒,写的每篇博客都要写三四个小时(加上自己学习和纸质笔记,共五六小时吧),很累希望大佬支持

道阻且长 行则将至个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力

Ongwu博客 版权声明:以上内容未经允许不得转载!授权事宜或对内容有异议或投诉,请联系站长,将尽快回复您,谢谢合作!

展开全文READ MORE
365Scores安卓版(查看体育赛事比分) v13.5.6 修改版 Javafx利用fxml变换场景的小细节

游客 回复需填写必要信息