示例:实现短网址生成程序

为了给用户提供更多发言空间,并记录用户在网站上的链接点击行为,大部分社交网站都会将用户输入的网址转换为相应的短网址。比如说,如果我们在新浪微博发言时输入网址 http://redisdoc.com/geo/index.html ,那么微博将把这个网址转换为相应的短网址 http://t.cn/RqRRZ8n ,当用户访问这个短网址时,微博在后台就会对这次点击进行一些数据统计,然后再引导用户的浏览器跳转到 http://redisdoc.com/geo/index.html 上面。

创建短网址本质上就是要创建出短网址 ID 与目标网址之间的映射,并在用户访问短网址时,根据短网址的 ID 从映射记录中找出与之相对应的目标网址。比如在前面的例子中,微博的短网址程序就将短网址 http://t.cn/RqRRZ8n 中的 ID 值 RqRRZ8n 映射到了 http://redisdoc.com/geo/index.html 这个网址上面:当用户访问短网址 http://t.cn/RqRRZ8n 时,程序就会根据这个短网址的 ID 值 RqRRZ8n ,找出与之对应的目标网址 http://redisdoc.com/geo/index.html ,并将用户引导至目标网址上面去。

作为示例,图 3-8 展示了几个微博短网址 ID 与目标网址之间的映射关系。


图 3-8 微博短网址映射关系示例_images/IMAGE_URL_MAPPING.png


因为 Redis 的散列正好就非常适合用来储存短网址 ID 与目标网址之间的映射,所以我们可以基于 Redis 的散列实现一个短网址程序,代码清单 3-1 展示了一个这样的例子。


代码清单 3-1 使用散列实现的短网址程序:/hash/shorty_url.py

  1. from base36 import base10_to_base36
  2.  
  3. ID_COUNTER = "ShortyUrl::id_counter"
  4. URL_HASH = "ShortyUrl::url_hash"
  5.  
  6. class ShortyUrl:
  7.  
  8. def __init__(self, client):
  9. self.client = client
  10.  
  11. def shorten(self, target_url):
  12. """
  13. 为目标网址创建并储存相应的短网址 ID 。
  14. """
  15. # 为目标网址创建新的数字 ID
  16. new_id = self.client.incr(ID_COUNTER)
  17. # 通过将 10 进制数字转换为 36 进制数字来创建短网址 ID
  18. # 比如说,10 进制数字 10086 将被转换为 36 进制数字 7S6
  19. short_id = base10_to_base36(new_id)
  20. # 把短网址 ID 用作字段,目标网址用作值,
  21. # 将它们之间的映射关系储存到散列里面
  22. self.client.hset(URL_HASH, short_id, target_url)
  23. return short_id
  24.  
  25. def restore(self, short_id):
  26. """
  27. 根据给定的短网址 ID ,返回与之对应的目标网址。
  28. """
  29. return self.client.hget(URL_HASH, short_id)

代码清单 3-2 将 10 进制数字转换成 36 进制数字的程序:/hash/base36.py

  1. def base10_to_base36(number):
  2. alphabets = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ"
  3. result = ""
  4.  
  5. while number != 0 :
  6. number, i = divmod(number, 36)
  7. result = (alphabets[i] + result)
  8.  
  9. return result or alphabets[0]

ShortyUrl 类的 shorten() 方法负责为输入的网址生成短网址 ID ,它的工作包括以下四个步骤:

  • 为每个给定的网址创建一个 10 进制数字 ID 。

  • 将 10 进制数字 ID 转换为 36 进制,并将这个 36 进制数字用作给定网址的短网址 ID ,这种方法在数字 ID 长度较大时可以有效地缩短数字 ID 的长度。代码清单 3-2 展示了将数字从 10 进制转换成 36 进制的 base10_to_base36 函数的具体实现。

  • 将短网址 ID 和目标网址之间的映射关系储存到散列里面。

  • 向调用者返回刚刚生成的短网址 ID 。

另一方面,restore() 方法要做的事情和 shorten() 方法正好相反:它会从储存着映射关系的散列里面取出与给定短网址 ID 相对应的目标网址,然后将其返回给调用者。

以下代码简单地展示了使用 ShortyUrl 程序创建短网址 ID 的方法,以及根据短网址 ID 获取目标网址的方法:

  1. >>> from redis import Redis
  2. >>> from shorty_url import ShortyUrl
  3. >>> client = Redis(decode_responses=True)
  4. >>> shorty_url = ShortyUrl(client)
  5. >>> shorty_url.shorten("RedisGuide.com") # 创建短网址 ID
  6. '1'
  7. >>> shorty_url.shorten("RedisBook.com")
  8. '2'
  9. >>> shorty_url.shorten("RedisDoc.com")
  10. '3'
  11. >>> shorty_url.restore("1") # 根据短网址 ID 查找目标网址
  12. 'RedisGuide.com'
  13. >>> shorty_url.restore("2")
  14. 'RedisBook.com'

图 3-9 展示了上面这段代码在数据库中创建的散列结构。


图 3-9 短网址程序在数据库中创建的散列结构_images/IMAGE_SHORTY_URL_EXAMPLE.png