第03章数据分析入门 - 5. 用sort_values复现nlargest方法 - 《Pandas Cookbook 带注释源码》

5. 用sort_values复现nlargest方法

#  和前面一样nlargest和nsmallest链式操作进行选取
 In[42]: movie = pd.read_csv('data/movie.csv')
         movie2 = movie[['movie_title', 'imdb_score', 'budget']]
         movie_smallest_largest = movie2.nlargest(100, 'imdb_score').nsmallest(5, 'budget')
         movie_smallest_largest
Out[42]:

#  用sort_values方法，选取imdb_score最高的100个
 In[43]: movie2.sort_values('imdb_score', ascending=False).head(100).head()
Out[43]: 
#  然后可以再.sort_values('budget').head()，选出预算最低的5个，结果如下

这两种方法得到的最小的5部电影不同，用tail进行调查：

#  tail可以查看尾部
 In[45]: movie2.nlargest(100, 'imdb_score').tail()
Out[45]:

 In[46]: movie2.sort_values('imdb_score', ascending=False).head(100).tail()
Out[46]:

这是因为评分在8.4以上的电影超过了100部。