5. 用sort_values复现nlargest方法

  1. # 和前面一样nlargest和nsmallest链式操作进行选取
  2. In[42]: movie = pd.read_csv('data/movie.csv')
  3. movie2 = movie[['movie_title', 'imdb_score', 'budget']]
  4. movie_smallest_largest = movie2.nlargest(100, 'imdb_score').nsmallest(5, 'budget')
  5. movie_smallest_largest
  6. Out[42]:

5. 用sort_values复现nlargest方法 - 图1

  1. # 用sort_values方法,选取imdb_score最高的100个
  2. In[43]: movie2.sort_values('imdb_score', ascending=False).head(100).head()
  3. Out[43]:
  4. # 然后可以再.sort_values('budget').head(),选出预算最低的5个,结果如下

5. 用sort_values复现nlargest方法 - 图2

这两种方法得到的最小的5部电影不同,用tail进行调查:

  1. # tail可以查看尾部
  2. In[45]: movie2.nlargest(100, 'imdb_score').tail()
  3. Out[45]:

5. 用sort_values复现nlargest方法 - 图3

  1. In[46]: movie2.sort_values('imdb_score', ascending=False).head(100).tail()
  2. Out[46]:

5. 用sort_values复现nlargest方法 - 图4

这是因为评分在8.4以上的电影超过了100部。