Pandas | value_counts() 的详细用法

编程之家收集整理的这篇文章主要介绍了Pandas | value_counts() 的详细用法编程之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

value_counts() 函数得作用

用来统计数据表中,指定列里有多少个不同的数据值,并计算每个不同值有在该列中的个数,同时还能根据指定得参数返回排序后结果。
返回得是Series对象

value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True)
  • sort=True: 是否要进行排序;认进行排序
  • ascending=False: 认降序排列;
  • normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,认是False。
  • bins=None: 可以自定义分组区间,认是否
  • dropna=True:是否删除缺失值nan,删除

数据集

在这里插入图片描述


要求:统计不同lable出现得次数

任何参数都不带

train_df['label'].value_counts() 

统计个数并降序返回

在这里插入图片描述

  • ascending=True

    在这里插入图片描述

  • normalize=True
    数据标准化:在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。
    数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
train_df['label'].value_counts(ascending=False,normalize=True) 

数据标准化以后,所有得项得和为1(可能因为计算机存储数据而有误差)
常用来计算各数据占的比例

在这里插入图片描述

  • bins分组统计
    对于数值型的可以进行分组,分组以后返回结果

    在这里插入图片描述

几种使用方式

  • 先取出列(Series对象),然后调用函数这时候相当于
train_df['label'].value_counts() 
  • DataFrame
    对每一列都进行统计
train_df.apply(pd.value_counts)  
pd.value_counts(train_df['label'],ascending=True)

同样的统计还可以使用 groupby,这个的过程是先按‘label’分组然后再统计每组的值,这样的效率较低,不建议使用

train_df.groupby('label').count()

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


学习编程是顺着互联网的发展潮流,是一件好事。新手如何学习编程?其实不难,不过在学习编程之前你得先了解你的目的是什么?这个很重要,因为目的决定你的发展方向、决定你的发展速度。
IT行业是什么工作做什么?IT行业的工作有:产品策划类、页面设计类、前端与移动、开发与测试、营销推广类、数据运营类、运营维护类、游戏相关类等,根据不同的分类下面有细分了不同的岗位。
女生学Java好就业吗?女生适合学Java编程吗?目前有不少女生学习Java开发,但要结合自身的情况,先了解自己适不适合去学习Java,不要盲目的选择不适合自己的Java培训班进行学习。只要肯下功夫钻研,多看、多想、多练
转载:https://www.cnblogs.com/qgc1995/archive/2018/08/29/9553572.html一,Docke
插件leaflet-minimap。
银河麒麟高级服务器操作系统V10SP1 - ISO镜像定制 + KickStart自动化安装
优点:缺点:对于查询而言,除了使用resultType指定返回记录类型,也可以使用resultMap进行查询结果的映射。resultMap用于如下两种
查等级方式:查询出工资等级大于等于 员工平均工资的等级的员工,也能查出工资大于平均工资的员工。– 注意:一般在多表联查的时候,放在前面的表-称为主表,