更多精彩内容,欢迎关注:

视频号
视频号

抖音
抖音

快手
快手

微博
微博

Python数据分析处理(三)--运动员信息的分组与聚合

导读这篇文章主要介绍了根据Python数据清洗与处理的相关资料,展开运动员信息的分组与聚合的文章内容。首先使用pd.read_csv(f,skiprows=0,header=0)进行数据的读取,并且将数据转换成为dataframe的格式给对象,做初始化,方便后面进行数据的分析。
1、 数据的爬取

代码:

import pandas as pd
f = open('运动员信息表.csv')
data=pd.read_csv(f,skiprows=0,header=0)
print(data)

运行结果:

首先使用pd.read_csv(f,skiprows=0,header=0)进行数据的读取,并且将数据转换成为dataframe的格式给对象,做初始化,方便后面进行数据的分析。

2、统计男篮、女篮运动员的平均年龄、身高、体重

代码:

sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"])

print(sex.mean())

运行结果:

首先我们先把数据提取出来做个分组,先把"年龄(岁)",“身高(cm)”,"体重(kg)"这三行数据提取出来再根据性别进行分组。

sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"])

然后再调用mean()求平均值,求出男篮、女篮运动员的平均年龄、身高、体重。

3、统计男篮运动员年龄、身高、体重的极差值

代码:

sex=data[["年龄(岁)","身高(cm)","体重(kg)"]].groupby(data["性别"])
basketball_male=dict([x for x in sex])['男']
basketball_male
#求极差
def range_data_group(arr):
    return arr.max()-arr.min()
#进行每列不同的聚合
basketball_male.agg({
"年龄(岁)":range_data_group,"身高(cm)":range_data_group,"体重(kg)":range_data_group
})

运行结果:

首先提取数据:

单行循环提取数据,dict([x for x in sex])在循环体内的语句只有一行的情况的下,可以简化for循环的书写。定义一个函数def range_data_group(arr):求极差;

极差的求法:使用最大值减去最小值。就得到极差。

agg()函数:DataFrame.agg(*func*,*axis = 0*,* args*,*** kwargs* )*

func : 函数,函数名称,函数列表,字典{‘行名/列名’,‘函数名’}

使用指定轴上的一个或多个操作进行聚合。

需要注意聚合函数操作始终是在轴(默认是列轴,也可设置行轴)上执行,不同于 numpy聚合函数

最后我们可以得到三列数据:分别对应"年龄(岁)",“身高(cm)”,“体重(kg)”。

4 、统计男篮运动员的体质指数4.1添加体重指数

代码:

data["体质指数"]=0
data

运行结果:

添加一行体重指数:data[“体质指数”]=0

4.2计算bmi值并添加数据

代码:

# 计算bmi数值
def outer(num):
    def bminum(sumbim):
        weight=data["身高(cm)"]
        height=data["体重(kg)"]
        sumbim=weight/(height/100)**2
        return num+sumbim
    return bminum

将该行数据添加上去:

代码:

# 调用函数
bimdata=data["体质指数"]
data["体质指数"]=data[["体质指数"]].apply(outer(bimdata))
data

运行结果:

编写函数计算bmi数值 outer(num);然后再使用apply的方法将自定义的函数应用到"体质指数"这一列。然后计算出该列的值之后进行赋值。

data[“体质指数”]=data[[“体质指数”]].apply(outer(bimdata))97622)]

编写函数计算bmi数值 outer(num) ;然后再使用apply的方法将自定义的函数应用到"体质指数"这一列。然后计算出该列的值之后进行赋值。

data[“体质指数”]=data[[“体质指数”]].apply(outer(bimdata))

到此这篇关于Python数据分析处理,运动员信息的分组与聚合的文章就介绍到这了。更多相关Python数据分析处理内容请搜索好二三四,希望大家以后多多支持好二三四!

为你推荐
资讯专栏
热门视频
相关推荐
基于Python实现PDF区域文本提取工具 详解python的循环 python实现新年倒计时实例代码 Python实现消消乐小游戏 学习python的while循环嵌套 提升Python运行速度的5个小技巧 Python按键或值对字典进行排序 图像检索之基于vlfeat实现SIFT特征 python绘图中的四个绘图技巧 js中toString方法3个作用 信息系统项目管理师报考条件 信息系统项目管理师报考时间 信息系统项目管理师报名时间 信息系统项目管理师考试时间 pmp与信息系统项目管理师 信息系统项目管理师报考要求 信息系统项目管理师有效期 信息系统项目管理师考什么论文 信息系统项目管理师是什么类别 软考信息系统项目管理师怎么备考 备考流程有哪些 Python实现城市公交网络分析与可视化 Python 垃圾回收机制详解 python正则表达式语法学习笔记 一文秒懂python正则表达式常用函数 Python常用的正则表达式处理函数详解 JS截取字符串的三种方法详解 PHP遍历数组的6种方式总结 php两种基本的输出方及实例详解 php生成唯一uid的解决方法详解 PHP7中对十六进制字符串处理的问题详解 PHP对接抖音开发平台接口的详细教程 php7安装mysqli实例讲解 php去掉一维数组的键值的实例方法 PHP中empty()和isset()的区别介绍 PHP实现JWT的Token登录认证 php判断时间戳是否为今天实例讲解 PHP7 preg_replace出错及解决办法 五年班的学习计划怎么写 五年级的学习计划 初中新学期学习计划怎么写 关于英语的学习计划怎么写
Top