博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python/pandas/Numpy数据分析-统计描述,唯一值,值计数
阅读量:6237 次
发布时间:2019-06-22

本文共 856 字,大约阅读时间需要 2 分钟。

pandas 对象拥有一组常用的数学和统计方法,大部分属于简约统计,用于从Series中提取一个值,或者从DataFrame中提取一列或者一行Series

注意:与NumPy数组相比,这些函数都是基于没有缺失数据的建设构建的,也就是说:这些函数会自动忽略缺失值。

count   非 NA 值的数量describe    针对 Series 或 DF 的列计算汇总统计min , max   最小值和最大值argmin , argmax 最小值和最大值的索引位置(整数)idxmin , idxmax 最小值和最大值的索引值quantile    样本分位数(0 到 1)sum 求和mean    均值median  中位数mad 根据均值计算平均绝对离差var 方差std 标准差skew    样本值的偏度(三阶矩)kurt    样本值的峰度(四阶矩)cumsum  样本值的累计和cummin , cummax 样本值的累计最大值和累计最小值cumprod 样本值的累计积diff    计算一阶差分(对时间序列很有用)pct_change  计算百分数变化

唯一值与值计数

obj=Series(list('cadaabbcc'))uniques=obj.unique()uniquesc    3a    3b    2d    1dtype: int64

排序的话

uniques.sort()uniquesarray(['a', 'b', 'c', 'd'], dtype=object)

value_counts用于计算一个Series中各值出现的频率.

obj.value_counts()a    3d    1b    2c    3dtype: int64

value_counts还是一个顶级pandas方法,可用于任何数组或序列

pd.value_counts(obj.values, sort=False)a    3d    1b    2c    3dtype: int64

这里写图片描述

你可能感兴趣的文章
AQS实现原理及成果(有图有真相)
查看>>
js操作cookie
查看>>
access数据库注入
查看>>
MySQL + Atlas --- 部署读写分离
查看>>
Zabbix 2.2 LTS升级到Zabbix 3.0 LTS
查看>>
TortoiseSVN的使用
查看>>
数据分页时每页首条记录索引如何计算
查看>>
CSICO 常见操作命令
查看>>
sql中两个时间类型相减得到的值
查看>>
FastDFS安装配置
查看>>
Python格式化输出的四种方法
查看>>
TypeScript入门
查看>>
记一次安装新版jre
查看>>
快速开始使用Python Thrift
查看>>
sql中的游标(一)
查看>>
nginx启动、重启、关闭
查看>>
CentOS 6.x 快速安装L2TP ***
查看>>
浅谈Listview中Adpter的用法
查看>>
设计模式----代理模式
查看>>
基于Socket的文件传输(使用CSocket类)
查看>>