第04章选取数据子集 - 3. 同时选取DataFrame的行和列 - 《Pandas Cookbook 带注释源码》

3. 同时选取DataFrame的行和列

#  读取college数据集，给行索引命名为INSTNM；选取前3行和前4列
 In[23]: college = pd.read_csv('data/college.csv', index_col='INSTNM')
         college.iloc[:3, :4]
Out[23]:

#  用loc实现同上功能
 In[24]: college.loc[:'Amridge University', :'MENONLY']
Out[24]:

#  选取两列的所有的行
 In[25]: college.iloc[:, [4,6]].head()
Out[25]:

#  loc实现同上功能
 In[26]: college.loc[:, ['WOMENONLY', 'SATVRMID']]
Out[26]:

#  选取不连续的行和列
 In[27]: college.iloc[[100, 200], [7, 15]]
Out[27]:

#  用loc和列表，选取不连续的行和列
 In[28]: rows = ['GateWay Community College', 'American Baptist Seminary of the West']
         columns = ['SATMTMID', 'UGDS_NHPI']
         college.loc[rows, columns]
Out[28]:

#  iloc选取一个标量值
 In[29]: college.iloc[5, -4]
Out[29]: 0.40100000000000002

#  loc选取一个标量值
 In[30]: college.loc['The University of Alabama', 'PCTFLOAN']
Out[30]: 0.40100000000000002

#  iloc对行切片，并只选取一列
 In[31]: college.iloc[90:80:-2, 5]
Out[31]: INSTNM
         Empire Beauty School-Flagstaff     0
         Charles of Italy Beauty College    0
         Central Arizona College            0
         University of Arizona              0
         Arizona State University-Tempe     0
         Name: RELAFFIL, dtype: int64

#  loc对行切片，并只选取一列
 In[32]: start = 'Empire Beauty School-Flagstaff'
         stop = 'Arizona State University-Tempe'
         college.loc[start:stop:-2, 'RELAFFIL']
Out[32]: INSTNM
         Empire Beauty School-Flagstaff     0
         Charles of Italy Beauty College    0
         Central Arizona College            0
         University of Arizona              0
         Arizona State University-Tempe     0
         Name: RELAFFIL, dtype: int64