5. 用sort_values复现nlargest方法
# 和前面一样nlargest和nsmallest链式操作进行选取
In[42]: movie = pd.read_csv('data/movie.csv')
movie2 = movie[['movie_title', 'imdb_score', 'budget']]
movie_smallest_largest = movie2.nlargest(100, 'imdb_score').nsmallest(5, 'budget')
movie_smallest_largest
Out[42]:
# 用sort_values方法,选取imdb_score最高的100个
In[43]: movie2.sort_values('imdb_score', ascending=False).head(100).head()
Out[43]:
# 然后可以再.sort_values('budget').head(),选出预算最低的5个,结果如下
这两种方法得到的最小的5部电影不同,用tail进行调查:
# tail可以查看尾部
In[45]: movie2.nlargest(100, 'imdb_score').tail()
Out[45]:
In[46]: movie2.sort_values('imdb_score', ascending=False).head(100).tail()
Out[46]:
这是因为评分在8.4以上的电影超过了100部。