pandas基础教程(四) DataFrame的前世今生

#头条创作挑战赛#

DataFrame


DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

参数说明:

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。
  • index:索引值,或者可以称为行标签。
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
  • dtype:数据类型。
  • copy:拷贝数据,默认为 False。

Pandas DataFrame 是一个二维的数组结构,类似二维数组。

使用列表创建

In [1]:

import pandas as pd

data = [['Geogle',10],['baidu',8],['360',5]]
df = pd.DataFrame(data,columns=['Name','Age'],dtype=float)
print(df)
     Name   Age
0  Geogle  10.0
1   baidu   8.0
2     360   5.0

使用 ndarrays 创建

In [2]:

import pandas as pd
data = {'Name':['Google', 'Baidu', '360'], 'Age':[10, 8, 5]}
df = pd.DataFrame(data)
print(df)
     Name  Age
0  Google   10
1   Baidu    8
2     360    5

使用字典创建

In [5]:

import pandas as pd
data = [{'Google':10,'Baidu':8,'360':5}]
df = pd.DataFrame(data)
print(df)
   Google  Baidu  360
0      10      8    5

Pandas 可以使用 loc 属性返回指定行的数据

In [7]:

import pandas as pd
data = {"calories": [420, 380, 390],"duration": [50, 40, 45]}# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)# 返回第一行
print(df.loc[0]) # 返回第一行和第二行
print(df.loc[[0, 1]])
calories    420
duration     50
Name: 0, dtype: int64
   calories  duration
0       420        50
1       380        40

指定索引值

In [4]:

import pandas as pd
data = {br  "calories": [420, 380, 390],"duration": [50, 40, 45]} # 数据载入到 DataFrame 对象
df = pd.DataFrame(data,index=["day01","day02","day03"])# 返回calories
print(df.loc["day01"])
calories    420
duration     50
Name: day01, dtype: int64
发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章