在 Python 中,可以使用 pandas 库创建 DataFrame,以下是几种常见的方法:

方法 1:从字典创建 DataFrame
字典的键作为列名,值作为对应列的数据。
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Paris', 'London']
}
df = pd.DataFrame(data)
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Paris
2 Charlie 35 London
方法 2:从列表的列表创建 DataFrame
每个子列表代表一行数据,可以指定列名。
import pandas as pd
data = [
['Alice', 25, 'New York'],
['Bob', 30, 'Paris'],
['Charlie', 35, 'London']
]
df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Paris
2 Charlie 35 London
方法 3:从 NumPy 数组创建 DataFrame
适用于数值型数据。
import pandas as pd
import numpy as np
data = np.array([
[1, 'Alice', 25],
[2, 'Bob', 30],
[3, 'Charlie', 35]
])
df = pd.DataFrame(data, columns=['ID', 'Name', 'Age'])
print(df)
输出:
ID Name Age
0 1 Alice 25
1 2 Bob 30
2 3 Charlie 35
方法 4:从列表的字典创建 DataFrame
每个字典代表一行数据,键为列名。
import pandas as pd
data = [
{'Name': 'Alice', 'Age': 25, 'City': 'New York'},
{'Name': 'Bob', 'Age': 30, 'City': 'Paris'},
{'Name': 'Charlie', 'Age': 35, 'City': 'London'}
]
df = pd.DataFrame(data)
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 Paris
2 Charlie 35 London
方法 5:从 CSV 文件读取(常见实际应用)
import pandas as pd
df = pd.read_csv('data.csv') # 假设文件名为 data.csv
print(df)
方法 6:创建空 DataFrame
import pandas as pd df = pd.DataFrame() # 空 DataFrame print(df)
| 方法 | 适用场景 |
|---|---|
| 字典 | 列名已知,数据按列组织 |
| 列表的列表 | 数据按行组织,需指定列名 |
| NumPy 数组 | 数值型数据 |
| 列表的字典 | 每行数据是字典(键为列名) |
| CSV 文件 | 从外部文件读取数据 |
选择合适的方法取决于数据的结构和来源。
