admin 管理员组

文章数量: 1184232


2024年4月24日发(作者:连线过去改变未来)

python的df用法

DataFrame是pandas库中最重要的数据结构之一,它可以看作是由多个Series按列组

成的二维表格。通过DataFrame,我们可以很方便地进行数据的处理、分析和可视化等操

作。接下来,我们将深入探讨DataFrame在Python中的使用方法。

一、DataFrame的创建

可以使用以下方法来创建DataFrame对象:

1.从列表、元组、字典等数据结构中创建

import pandas as pd

# 从列表中创建DataFrame

data = [['Alice', 25, 158], ['Bob', 35, 175], ['Charlie', 45, 180]]

df = ame(data, columns=['name', 'age', 'height'])

print(df)

2.从csv文件中读取数据并创建DataFrame

# 从csv文件中读取数据

df = _csv('', encoding='utf-8')

print(df)

1.查看数据

# 查看头5行数据

print(())

2.选取数据

使用[]或loc[]、iloc[]方法可以选择DataFrame中的部分数据。

# 选取多列数据

print(df[['name', 'age']])

# 使用loc[]方法选取指定行的数据

print([3])

3.修改数据

# 修改某一列数据

df['age'] = [26, 36, 46, 56]

4.添加数据

可以使用[]或loc[]方法添加新的数据。

5.删除数据

# 删除某一行数据

df = (3)

6.统计数据

可以使用describe()方法对DataFrame中的数值型数据进行基本的统计分析。

三、数据的筛选和排序

四、数据的分组和聚合

# 按照性别进行分组

groups = y('gender')

for name, group in groups:

print(name)

print(group)

可以使用聚合函数对分组后的数据进行聚合操作。

# 按照性别进行分组

groups = y('gender')

# 计算平均年龄和身高

res = ({'age': 'mean', 'height': 'mean'})

print(res)

五、数据的合并和重塑

可以使用merge()方法将多个DataFrame合并成一个DataFrame。

以上就是DataFrame的一些基本操作方法,掌握这些方法可以帮助我们更好地进行数

据的处理和分析,进一步提高我们的数据分析能力。


本文标签: 数据 方法 进行 分组