admin 管理员组文章数量: 1184232
2024年3月7日发(作者:java 反射的使用)
dataframe的基本用法(一)
DataFrame的基本
什么是DataFrame?
DataFrame是Pandas库中最重要的数据结构之一,它可以以表格的形式存储和处理数据。DataFrame是由多个列构成的二维数组,每个列可以是不同的数据类型(整数、浮点数、字符串等)。
创建DataFrame
从列表创建DataFrame
可以使用()函数从一个列表创建DataFrame,列表的每个元素代表一列的数据。
import pandas as pd
data = [['Alice', 25],['Bob', 30],['Charlie', 35]]
df = (data, columns=['Name', 'Age'])
print(df)
该代码将输出以下结果:
Name Age
0 Alice 25
1 Bob 30
2 Charlie 35
从字典创建DataFrame
可以使用()函数从一个字典创建DataFrame,字典的每个键值对代表一列的数据。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = (data)
print(df)
该代码将输出以下结果:
Name Age
0 Alice 25
1 Bob 30
2 Charlie 35
访问DataFrame
访问列
可以使用列标签访问DataFrame中的某一列。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = (data)
print(df['Name'])
该代码将输出以下结果:
0 Alice
1 Bob
2 Charlie
Name: Name, dtype: object
访问行
可以使用iloc[]函数和行索引来访问DataFrame中的某一行。注意,行索引从0开始。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = (data)
print([0])
该代码将输出以下结果:
Name Alice
Age 25
Name: 0, dtype: object
修改DataFrame
修改列名
可以使用rename()函数修改DataFrame中的列名。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = (data)
df = (columns={'Name': 'FullName'})
print(df)
该代码将输出以下结果:
FullName Age
0 Alice 25
1 Bob 30
2 Charlie 35
新增列
可以使用列标签直接赋值的方式新增一列。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = (data)
df['Gender'] = ['Female', 'Male', 'Male']
print(df)
该代码将输出以下结果:
Name Age Gender
0 Alice 25 Female
1 Bob 30 Male
2 Charlie 35 Male
删除列
可以使用drop()函数删除DataFrame中的某一列。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}
df = (data)
df = (columns=['Gender'])
print(df)
该代码将输出以下结果:
Name Age
0 Alice 25
1 Bob 30
2 Charlie 35
总结
以上是DataFrame的一些基本用法。DataFrame提供了丰富的功能,可以方便地进行数据处理和分析。希望本文对你有所帮助!
数据筛选
可以使用一些条件来筛选DataFrame中的数据,例如,筛选出年龄大于30的人的数据。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}
df = (data)
filtered_df = df[df['Age'] > 30]
print(filtered_df)
该代码将输出以下结果:
Name Age Gender
2 Charlie 35 Male
数据排序
可以使用sort_values()函数对DataFrame中的数据进行排序。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}
df = (data)
sorted_df = _values(by='Age')
print(sorted_df)
该代码将输出以下结果:
Name Age Gender
0 Alice 25 Female
1 Bob 30 Male
2 Charlie 35 Male
数据汇总
可以使用describe()函数对DataFrame中的数据进行汇总统计。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}
df = (data)
summary = ()
print(summary)
该代码将输出以下结果:
Age
count
mean
std
min
25%
50%
75%
max
数据合并
可以使用concat()函数将多个DataFrame按行或列合并。
import pandas as pd
data1 = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}
data2 = {'Name': ['Charlie'], 'Age': [35]}
df1 = (data1)
df2 = (data2)
merged_df = ([df1, df2], ignore_index=True)
print(merged_df)
该代码将输出以下结果:
Name Age
0 Alice 25
1 Bob 30
2 Charlie 35
数据透视表
可以使用pivot_table()函数创建和操作数据透视表。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Gender': ['Female', 'Male', 'Male']}
df = (data)
pivot = _table(df, values='Age', index='Gender', columns='Name')
print(pivot)
该代码将输出以下结果:
Name Alice Bob Charlie
Gender
Female NaN NaN
Male NaN
以上是DataFrame的一些常见用法,仅作为入门指南。Pandas库提供了更多的功能和操作,可以根据需要进一步学习和探索。希望本文对您有所帮助!
版权声明:本文标题:dataframe的基本用法(一) 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1709819422a547322.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论