Python pandas

from pandas import Series,DataFrameimport pandas as pd‘‘‘index

obj2= Series([4,7,-5,3],index=[‘d‘,‘b‘,‘a‘,‘c‘])obj2.valuesobj2.index

obj2[‘a‘]obj2[‘c‘]

obj2[‘d‘] = 6obj2[[‘c‘,‘d‘,‘a‘]]

obj2obj2[obj2>0]obj2*2import numpy as npnp.exp(obj2)

‘‘‘ dict‘b‘ in obj2‘e‘ in obj2

data = {‘Ohio‘:35000,‘Texas‘:71000,‘Oregon‘:16000,‘Utah‘:5000}obj3 = Series(data)

obj3

‘‘‘passing a dictstates = [‘California‘,‘Ohio‘,‘Oregon‘,‘Texas‘]obj4 = Series(data,index=states)

‘‘‘missing datapd.isnull(obj4)pd.notnull(obj4)

‘‘‘auto align indexobj3obj4obj3+obj4

‘‘‘name and renameobj4.name = ‘population‘obj4.index.name = ‘state‘

obj4

obj2.index=[‘Bob‘,‘Helen‘,‘Jeff‘,‘Ryan‘]

‘‘‘dataframe,by default by name orderdata={‘state‘:[‘Ohio‘,‘Ohio‘,‘Ohio‘,‘Nevada‘,‘Nevada‘],‘year‘:[2000,2001,2002,2001,2002],‘pop‘:[1.5,1.7,3.6,2.4,2.9]}

frame = DataFrame(data)

‘‘‘order by special order

DataFrame(data,columns =[‘year‘,‘state‘,‘pop‘])

‘‘‘ add one column and indexframe2= DataFrame(data,columns=[‘year‘,‘state‘,‘pop‘,‘debt‘],index=[‘one‘,‘two‘,‘three‘,‘four‘,‘five‘])

frame2.columns

‘‘‘get value by columnsframe2[‘state‘]‘‘‘get value by indexframe2.ix[‘three‘]

‘‘‘assignment by indexframe2[‘debt‘] = 16.5frame2[‘debt‘] = np.arange(5.)

val = Series([-1.2,-1.5,-1.7],index=[‘two‘,‘four‘,‘five‘])frame2[‘debt‘] = val

‘‘‘del columnsframe2[‘eastern‘] = frame2.state == ‘Ohio‘del frame2[‘eastern‘]

‘‘‘nest dictpop={‘Nevada‘:{2001:2.4,2002:2.9},‘Ohio‘:{2000:1.5,2001:1.7,2002:3.6}}

frame3=DataFrame(pop)

‘‘‘transpose the frame

frame3.T

‘‘‘index changes different with seriesDataFrame(pop,index=[2001,2002,2003])‘‘‘dataframe get valuepdata = {‘Ohio‘:frame3[‘Ohio‘][:-1],          ‘Nevada‘:frame3[‘Nevada‘][:2]}

DataFrame(pdata)

‘‘‘data frame index and column name attributeframe3.index.name = ‘year‘;frame3.columns.name = ‘state‘frame3
时间: 05-08

Python pandas的相关文章

Python pandas 'HDFStore requires PyTables' Issue

Python pandas 'HDFStore requires PyTables' Issue 在运行mobike.py过程中,一直报错,原因是pip install tables命令中安装的pytables文件其实是存在问题的,后续有人修正了这个问题并发布了新的tables库 因此在安装的时候 pip install tables==3.3.0 Python pandas 'HDFStore requires PyTables' Issue

Python pandas 0.19.1 Indexing and Selecting Data文档翻译

最近在写个性化推荐的论文,经常用到Python来处理数据,被pandas和numpy中的数据选取和索引问题绕的比较迷糊,索性把这篇官方文档翻译出来,方便自查和学习,翻译过程中难免很多不到位的地方,但大致能看懂,错误之处欢迎指正~ Python pandas 0.19.1 Indexing and Selecting Data 原文链接 http://pandas.pydata.org/pandas-docs/stable/indexing.html 数据索引和选取 pandas对象中的轴标签信息

python pandas 使用

摘要   一.创建对象 二.查看数据 三.选择和设置 四.缺失值处理 五.相关操作 六.聚合 七.重排(Reshaping) 八.时间序列 九.Categorical类型   十.画图 十一.导入和保存数据 内容 # coding=utf-8import pandas as pdimport numpy as np### 一.创建对象## 1.可以传递一个list对象创建一个Series,Pandas会默认创建整型索引s = pd.Series([1, 3, 5, np.nan, 6, 8])#

python pandas.DataFrame选取、修改数据最好用.loc,.iloc,.ix

先手工生出一个数据框吧 [python] view plain copy import numpy as np import pandas as pd df = pd.DataFrame(np.arange(0,60,2).reshape(10,3),columns=list('abc')) df 是这样子滴 那么这三种选取数据的方式该怎么选择呢? 一.当每列已有column name时,用 df [ 'a' ] 就能选取出一整列数据.如果你知道column names 和index,且两者都很

Python Pandas 分析郁达夫《故都的秋》

最近刚学这块,如果有错误的地方还请大家担待. 本文用到的Python包: Ipython, Numpy, Pandas, Matplotlib 故都的秋原文参考:http://www.xiexingcun.com/mingjiaxiejing/302.htm 1. 郁达夫在文章结尾的落款处点明了日期. 一九三四年八月,在北平 但是1934年的数据我暂时找不到,只好拿2004年的代替,月份锁定在8月(公历 参考 知乎 民国时期的人知道公元纪年吗?). 2. 可是啊,北国的秋,却特别地来得清,来得静

Python: Pandas运算的效率探讨以及如何选择高效的运算方式

本文就Pandas的运行效率作一个对比的测试,来探讨用哪些方式,会使得运行效率较好. 测试环境如下: windows 7, 64位 python 3.5 pandas 0.19.2 numpy 1.11.3 jupyter notebook 需要说明的是,不同的系统,不同的电脑配置,不同的软件环境,运行结果可能有些差异.就算是同一台电脑,每次运行时,运行结果也不完全一样. 1 测试内容 测试的内容为,分别用三种方法来计算一个简单的运算过程,即 a*a+b*b . 三种方法分别是: python的

python pandas numpy matplotlib 常用方法及函数

import numpy as np import pandas as pd import matplotlib.pyplot as plt ---------------numpy----------------------- arr = np.array([1,2,3], dtype=np.float64) np.zeros((3,6)) np.empty((2,3,2)) np.arange(15) arr.dtype arr.ndim arr.shape arr.astype(np.in

Python pandas 数据框的str列内置的方法详解

原文链接:http://www.datastudy.cc/to/31 在使用pandas框架的DataFrame的过程中,如果需要处理一些字符串的特性,例如判断某列是否包含一些关键字,某列的字符长度是否小于3等等这种需求,如果掌握str列内置的方法,处理起来会方便很多. 下面我们来详细了解一下,Series类的str自带的方法有哪些. 1.cat() 拼接字符串 例子: >>> Series(['a', 'b', 'c']).str.cat(['A', 'B', 'C'], sep=',

python pandas库学习

两种数据结构Series和DataFrame. Series Series与python中的列表一样,数据和索引值. 这里我们创建了一个Series对象.Series对象的数据值和索引: 列表的索引是从0开始的,Series默认情况下和列表类似从0开始索引.但是也可以自定义索引: 索引可以重定义: 根据索引操作元素: Series也可是使用字典的形式: Series自动对齐:可以根据原来的索引找出对应值,没有则用NaN 判断值是否为空: Series运算操作: 大小 加减乘除 DataFrame

python pandas 获取列数据的几种方法及书写形式比较

pandas获取列数据位常用功能,但在写法上还有些要注意的地方,在这里总结一下: ''' author: zilu.tang 2015-12-31 ''' import pandas as pd data1 = pd.DataFrame(...) #任意初始化一个列数为3的DataFrame data1.columns=['a', 'b', 'c'] 1. data1['b'] #这里取到第2列(即b列)的值 2. data1.b #效果同1,取第2列(即b列) #这里b为列名称,但必须是连续字