断路器

概述

断路器又叫熔断器,是一种保护机制,用于保护服务调用链路中的服务不被过多的请求压垮。当服务调用链路中的某个服务出现异常时,断路器会将该服务的调用请求拒绝,从而保护服务调用链路中的其他服务不被压垮。

比较知名的熔断器算法有 Hystrix 和 Sentinel,它们都是通过统计服务调用的成功率和响应时间来判断服务是否可用,从而实现熔断的功能。

go-zero 已经内置了熔断器组件 breaker.Breaker ,go-zero 中采用滑动窗口来进行数据采集,目前是以 10s 为一个窗口,单个窗口有40个桶,然后将窗口内采集的数据采用的是 google sre 算法计算是否开启熔断,详情可参考 https://landing.google.com/sre/sre-book/chapters/handling-overload/#eq2101。

使用

在 brreaker.Breaker’ 中,提供了 Do,DoWithAcceptable,DoWithFallback,DoWithFallbackAcceptable 四个方法,分别对应不同的场景。 而开发者可以通过 breaker 直接调用这些方法,或者创建一个 breaker 实例来调用,两种方法均可,直接调用其实本质上也会以 name 作为唯一 key 去获取/创建一个 breaker 实例。

Do

Do 方法默认按照错误率来判断服务是否可用,不支持指标自定义,也不支持错误回调。

  1. type mockError struct {
  2. status int
  3. }
  4. func (e mockError) Error() string {
  5. return fmt.Sprintf("HTTP STATUS: %d", e.status)
  6. }
  7. func main() {
  8. for i := 0; i < 1000; i++ {
  9. if err := breaker.Do("test", func() error {
  10. return mockRequest()
  11. }); err != nil {
  12. println(err.Error())
  13. }
  14. }
  15. }
  16. func mockRequest() error {
  17. source := rand.NewSource(time.Now().UnixNano())
  18. r := rand.New(source)
  19. num := r.Intn(100)
  20. if num%4 == 0 {
  21. return nil
  22. } else if num%5 == 0 {
  23. return mockError{status: 500}
  24. }
  25. return errors.New("dummy")
  26. }

DoWithAcceptable

DoWithAcceptable 支持自定义的采集指标,可以自主控制哪些情况是可以接受,哪些情况是需要加入熔断指标采集窗口的。

  1. type mockError struct {
  2. status int
  3. }
  4. func (e mockError) Error() string {
  5. return fmt.Sprintf("HTTP STATUS: %d", e.status)
  6. }
  7. func main() {
  8. for i := 0; i < 1000; i++ {
  9. if err := breaker.DoWithAcceptable("test", func() error {
  10. return mockRequest()
  11. }, func(err error) bool { // 当 mock 的http 状态码部位500时都会被认为是正常的,否则加入错误窗口
  12. me, ok := err.(mockError)
  13. if ok {
  14. return me.status != 500
  15. }
  16. return false
  17. }); err != nil {
  18. println(err.Error())
  19. }
  20. }
  21. }
  22. func mockRequest() error {
  23. source := rand.NewSource(time.Now().UnixNano())
  24. r := rand.New(source)
  25. num := r.Intn(100)
  26. if num%4 == 0 {
  27. return nil
  28. } else if num%5 == 0 {
  29. return mockError{status: 500}
  30. }
  31. return errors.New("dummy")
  32. }

DoWithFallback

DoWithFallback 默认采用错误率来判断服务是否可用,不支持指标自定义,但是支持熔断回调。

  1. package main
  2. import (
  3. "errors"
  4. "fmt"
  5. "math/rand"
  6. "time"
  7. "github.com/zeromicro/go-zero/core/breaker"
  8. )
  9. type mockError struct {
  10. status int
  11. }
  12. func (e mockError) Error() string {
  13. return fmt.Sprintf("HTTP STATUS: %d", e.status)
  14. }
  15. func main() {
  16. for i := 0; i < 1000; i++ {
  17. if err := breaker.DoWithFallback("test", func() error {
  18. return mockRequest()
  19. }, func(err error) error {
  20. // 发生了熔断,这里可以自定义熔断错误转换
  21. return errors.New("当前服务不可用,请稍后再试")
  22. }); err != nil {
  23. println(err.Error())
  24. }
  25. }
  26. }
  27. func mockRequest() error {
  28. source := rand.NewSource(time.Now().UnixNano())
  29. r := rand.New(source)
  30. num := r.Intn(100)
  31. if num%4 == 0 {
  32. return nil
  33. } else if num%5 == 0 {
  34. return mockError{status: 500}
  35. }
  36. return errors.New("dummy")
  37. }

DoWithFallbackAcceptable

DoWithFallbackAcceptable 支持采集指标自定义,也支持熔断回调。

  1. package main
  2. import (
  3. "errors"
  4. "fmt"
  5. "math/rand"
  6. "time"
  7. "github.com/zeromicro/go-zero/core/breaker"
  8. )
  9. type mockError struct {
  10. status int
  11. }
  12. func (e mockError) Error() string {
  13. return fmt.Sprintf("HTTP STATUS: %d", e.status)
  14. }
  15. func main() {
  16. for i := 0; i < 1000; i++ {
  17. if err := breaker.DoWithFallbackAcceptable("test", func() error {
  18. return mockRequest()
  19. }, func(err error) error {
  20. //发生了熔断,这里可以自定义熔断错误转换
  21. return errors.New("当前服务不可用,请稍后再试")
  22. }, func(err error) bool { // 当 mock 的http 状态码部位500时都会被认为是正常的,否则加入错误窗口
  23. me, ok := err.(mockError)
  24. if ok {
  25. return me.status != 500
  26. }
  27. return false
  28. }); err != nil {
  29. println(err.Error())
  30. }
  31. }
  32. }
  33. func mockRequest() error {
  34. source := rand.NewSource(time.Now().UnixNano())
  35. r := rand.New(source)
  36. num := r.Intn(100)
  37. if num%4 == 0 {
  38. return nil
  39. } else if num%5 == 0 {
  40. return mockError{status: 500}
  41. }
  42. return errors.New("dummy")
  43. }

以上方法都是通过 name 来获取/创建一个 breaker 实例,即熔断器名称相同的同属于一个熔断器控制,如果需要自定义 breaker 的配置,可以通过 NewBreaker 方法来创建一个 breaker 实例,通过实例你可以精确控制具体情况是放过还是拒绝。

  1. // 熔断器名称是一个可选参数,当不传时,默认采用一个随机值
  2. opt := breaker.WithName("test")
  3. b := breaker.NewBreaker(opt)
  4. // 快捷调用
  5. //b.Do()
  6. //b.DoWithAcceptable()
  7. //b.DoWithFallback()
  8. //b.DoWithFallbackAcceptable()
  9. // 自主控制放行/拒绝 case
  10. // mockRequest := func(status int) error {
  11. // p, err := b.Allow()
  12. // if err != nil {
  13. // return err
  14. // }
  15. // if status == 200 {
  16. // p.Accept()
  17. // }
  18. // p.Reject(fmt.Sprintf("HTTP STATUS: %d", status))
  19. // return nil
  20. // }
  21. // for i := 0; i < 100; i++ {
  22. // var mockStatus int
  23. // if i%10 == 0 {
  24. // mockStatus = 500
  25. // }
  26. // if err := mockRequest(mockStatus)(); err != nil {
  27. // fmt.Println(err)
  28. // }
  29. // }

HTTP & gRPC 中使用

在 go-zero 中,开发者不需要对请求单独进行熔断处理,该功能已经集成到了框架中,因此开发者无需关系。

HTTP 以请求方法+路由作为统计维度,用 HTTP 状态码 500 作为错误采集指标进行统计,详情可参考 breakerhandler.go

gRPC 客户端以 rpc 方法名作为统计维度,用 grpc 的错误码为 codes.DeadlineExceeded, codes.Internal, codes.Unavailable, codes.DataLoss, codes.Unimplemented 作为错误采集指标进行统计,详情可参考 breakerinterceptor.go

gRPC 服务端以 rpc 方法名称作为统计维度,用 grpc 的错误作为错误采集指标进行统计,详情可参考 breakerinterceptor.go

参考文献