本文研究学习pandas的series的基本功能,虽然series的重要性不比DataFrame,但在数据处理上并不意味着可以离开series, 下表是series的基本功能
编号 | 属性或方法 | 解释 |
---|---|---|
1 | axes | 返回行轴标签列表 |
2 | dtype | 返回对象的数据类型 |
3 | empty | 如果系列为空,则返回True |
4 | ndim | 返回底层数据的维数,默认定义:1 |
5 | size | 返回基础数据中的元素数 |
6 | values | 将系列作为ndarray返回 |
7 | head() | 返回前n行 |
8 | tail() | 返回最后n行 |
from pandas import Series
lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])
print(ser.axes)
程序输出结果
[Index(['a', 'b', 'c', 'd'], dtype='object')]
from pandas import Series
lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])
print(ser.dtype)
score_dict = {
'c++': 99,
'python': 100,
'c#': 98,
'java': 97
}
ser = Series(score_dict)
print(ser.dtype)
程序输出结果
object
int64
在series中,如果元素存在字符串,dtype则是object
如果series是空的,则empty属性为True
from pandas import Series
lst = []
ser = Series(lst)
print(ser.empty)
程序输出结果
True
返回底层数据的维度,series是1D的数据结构
from pandas import Series
lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])
print(ser.ndim)
程序输出结果是 1
size返回系列的大小
from pandas import Series
lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])
print(ser.size)
lst里只有4个元素,由此生成的series的size必然是4
将系列作为ndarray返回
from pandas import Series
lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])
print(ser.values)
score_dict = {
'c++': 99,
'python': 100,
'c#': 98,
'java': 97
}
ser = Series(score_dict)
print(ser.values, type(ser.values))
程序输出结果
['python' 'c++' 'c#' 'java']
[ 99 100 98 97] <class 'numpy.ndarray'>
values返回的数据类型是numpy.ndarray, 不是list,这一点务必要牢记
返回前n个数据,默认n=5, head是一种快速查看数据的方法,通过观察数据来了解当前数据的处理情况
from pandas import Series
lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])
print(ser.head(2))
程序输出结果
a python
b c++
dtype: object
功能和head一样,只是返回的是后n个数据
from pandas import Series
lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])
print(ser.tail(2))
程序输出结果
c c#
d java
dtype: object
QQ交流群: 211426309