admin 管理员组

文章数量: 1184232


2024年3月7日发(作者:java 反射的使用)

dataframe的基本用法(一)

DataFrame的基本

什么是DataFrame?

DataFrame是Pandas库中最重要的数据结构之一,它可以以表格的形式存储和处理数据。DataFrame是由多个列构成的二维数组,每个列可以是不同的数据类型(整数、浮点数、字符串等)。

创建DataFrame

从列表创建DataFrame

可以使用()函数从一个列表创建DataFrame,列表的每个元素代表一列的数据。

import pandas as pd

data = [['Alice', 25],['Bob', 30],['Charlie', 35]]

df = (data, columns=['Name', 'Age'])

print(df)

该代码将输出以下结果:

Name Age

0 Alice 25

1 Bob 30

2 Charlie 35

从字典创建DataFrame

可以使用()函数从一个字典创建DataFrame,字典的每个键值对代表一列的数据。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}

df = (data)

print(df)

该代码将输出以下结果:

Name Age

0 Alice 25

1 Bob 30

2 Charlie 35

访问DataFrame

访问列

可以使用列标签访问DataFrame中的某一列。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}

df = (data)

print(df['Name'])

该代码将输出以下结果:

0 Alice

1 Bob

2 Charlie

Name: Name, dtype: object

访问行

可以使用iloc[]函数和行索引来访问DataFrame中的某一行。注意,行索引从0开始。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}

df = (data)

print([0])

该代码将输出以下结果:

Name Alice

Age 25

Name: 0, dtype: object

修改DataFrame

修改列名

可以使用rename()函数修改DataFrame中的列名。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}

df = (data)

df = (columns={'Name': 'FullName'})

print(df)

该代码将输出以下结果:

FullName Age

0 Alice 25

1 Bob 30

2 Charlie 35

新增列

可以使用列标签直接赋值的方式新增一列。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}

df = (data)

df['Gender'] = ['Female', 'Male', 'Male']

print(df)

该代码将输出以下结果:

Name Age Gender

0 Alice 25 Female

1 Bob 30 Male

2 Charlie 35 Male

删除列

可以使用drop()函数删除DataFrame中的某一列。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}

df = (data)

df = (columns=['Gender'])

print(df)

该代码将输出以下结果:

Name Age

0 Alice 25

1 Bob 30

2 Charlie 35

总结

以上是DataFrame的一些基本用法。DataFrame提供了丰富的功能,可以方便地进行数据处理和分析。希望本文对你有所帮助!

数据筛选

可以使用一些条件来筛选DataFrame中的数据,例如,筛选出年龄大于30的人的数据。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}

df = (data)

filtered_df = df[df['Age'] > 30]

print(filtered_df)

该代码将输出以下结果:

Name Age Gender

2 Charlie 35 Male

数据排序

可以使用sort_values()函数对DataFrame中的数据进行排序。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}

df = (data)

sorted_df = _values(by='Age')

print(sorted_df)

该代码将输出以下结果:

Name Age Gender

0 Alice 25 Female

1 Bob 30 Male

2 Charlie 35 Male

数据汇总

可以使用describe()函数对DataFrame中的数据进行汇总统计。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}

df = (data)

summary = ()

print(summary)

该代码将输出以下结果:

Age

count

mean

std

min

25%

50%

75%

max

数据合并

可以使用concat()函数将多个DataFrame按行或列合并。

import pandas as pd

data1 = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}

data2 = {'Name': ['Charlie'], 'Age': [35]}

df1 = (data1)

df2 = (data2)

merged_df = ([df1, df2], ignore_index=True)

print(merged_df)

该代码将输出以下结果:

Name Age

0 Alice 25

1 Bob 30

2 Charlie 35

数据透视表

可以使用pivot_table()函数创建和操作数据透视表。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}

df = (data)

pivot = _table(df, values='Age', index='Gender', columns='Name')

print(pivot)

该代码将输出以下结果:

Name Alice Bob Charlie

Gender

Female NaN NaN

Male NaN

以上是DataFrame的一些常见用法,仅作为入门指南。Pandas库提供了更多的功能和操作,可以根据需要进一步学习和探索。希望本文对您有所帮助!


本文标签: 数据 函数 使用 创建 希望