步骤 21: 使用缓存提升性能

性能问题可能常常会出现。一些典型例子:缺少数据库索引、每个页面上太多的 SQL 请求。在空的数据库里,你不会有任何问题,但随着流量和数据量的增长,问题可能会在某个时刻显现出来。

增加 HTTP 缓存头

使用 HTTP 的缓存策略是一个最大化提升用户性能的好方案,而且它不用花费很多代价。为了更好的性能,可以在生产服务器上增加反向代理的缓存,也可以用 CDN 在靠近用户的节点上部署缓存。

让我们来把首页缓存一小时:

patch_file

  1. --- a/src/Controller/ConferenceController.php
  2. +++ b/src/Controller/ConferenceController.php
  3. @@ -33,9 +33,12 @@ class ConferenceController extends AbstractController
  4. #[Route('/', name: 'homepage')]
  5. public function index(ConferenceRepository $conferenceRepository): Response
  6. {
  7. - return new Response($this->twig->render('conference/index.html.twig', [
  8. + $response = new Response($this->twig->render('conference/index.html.twig', [
  9. 'conferences' => $conferenceRepository->findAll(),
  10. ]));
  11. + $response->setSharedMaxAge(3600);
  12. +
  13. + return $response;
  14. }
  15. #[Route('/conference/{slug}', name: 'conference')]

setSharedMaxAge() 方法来配置反向代理的缓存过期时间。用 setMaxAge() 方法来控制浏览器缓存时间。时间单位是秒(1 小时=60 分钟=3600 秒)。

缓存会议页面更有挑战一些,因为它的内容更加动态。任何人在任何时候都可以增加一条评论,没有人想要等一个小时才能看到它发布。在这种情况下,使用 HTTP 验证 的策略。

激活 Symfony 的 HTTP 缓存内核

为了测试 HTTP 缓存策略,我们来启用 Symfony 的 HTTP 反向代理:

patch_file

  1. --- a/config/packages/framework.yaml
  2. +++ b/config/packages/framework.yaml
  3. @@ -15,3 +15,5 @@ framework:
  4. #fragments: true
  5. php_errors:
  6. log: true
  7. +
  8. + http_cache: true

Symfony 的 HTTP 反向代理(由 HttpCache 类实现)不但是一个功能完善的 HTTP 反向代理,也以 HTTP 头的形式增加了友好的调试信息。这对验证我们已经设置的缓存头很有帮助。

在首页上检查缓存:

  1. $ curl -s -I -X GET https://127.0.0.1:8000/
  1. HTTP/2 200
  2. age: 0
  3. cache-control: public, s-maxage=3600
  4. content-type: text/html; charset=UTF-8
  5. date: Mon, 28 Oct 2019 08:11:57 GMT
  6. x-content-digest: en63cef7045fe418859d73668c2703fb1324fcc0d35b21d95369a9ed1aca48e73e
  7. x-debug-token: 9eb25a
  8. x-debug-token-link: https://127.0.0.1:8000/_profiler/9eb25a
  9. x-robots-tag: noindex
  10. x-symfony-cache: GET /: miss, store
  11. content-length: 50978

对于第一次请求,缓存服务器告诉你这是个 miss (未命中),而且它执行了 store (存储)来把应答缓存起来。检查 cache-control 头可以看到配置的缓存策略。

对于后续的请求,应答都是来自缓存( age 信息也会被更新):

  1. HTTP/2 200
  2. age: 143
  3. cache-control: public, s-maxage=3600
  4. content-type: text/html; charset=UTF-8
  5. date: Mon, 28 Oct 2019 08:11:57 GMT
  6. x-content-digest: en63cef7045fe418859d73668c2703fb1324fcc0d35b21d95369a9ed1aca48e73e
  7. x-debug-token: 9eb25a
  8. x-debug-token-link: https://127.0.0.1:8000/_profiler/9eb25a
  9. x-robots-tag: noindex
  10. x-symfony-cache: GET /: fresh
  11. content-length: 50978

用 ESI 来避免 SQL 请求

TwigEventSubscriber 事件监听器会在 Twig 里注入一个全局变量,该变量包含了所有的会议对象。网站的每一页里都会注入该变量。这很可能是一个优化的好目标。

你不会每天都去添加会议,所以代码总是一次次地从数据库里去查询完全相同的数据。

我们可能想要用 Symfony 来缓存会议的名字和 slug,但我喜欢尽可能地依靠 HTTP 缓存提供的机制。

当你想要缓存页面的一个片段时,通过创建一个 子请求 来把该片段从当前 HTTP 请求中移出。在这种使用场景下, ESI 是一个完美的搭配。一个 ESI 可以把一个 HTTP 请求的结果嵌入到另一个请求的结果。

创建一个控制器,让它只返回展示会议列表的 HTML 片段。

patch_file

  1. --- a/src/Controller/ConferenceController.php
  2. +++ b/src/Controller/ConferenceController.php
  3. @@ -41,6 +41,14 @@ class ConferenceController extends AbstractController
  4. return $response;
  5. }
  6. + #[Route('/conference_header', name: 'conference_header')]
  7. + public function conferenceHeader(ConferenceRepository $conferenceRepository): Response
  8. + {
  9. + return new Response($this->twig->render('conference/header.html.twig', [
  10. + 'conferences' => $conferenceRepository->findAll(),
  11. + ]));
  12. + }
  13. +
  14. #[Route('/conference/{slug}', name: 'conference')]
  15. public function show(Request $request, Conference $conference, CommentRepository $commentRepository, string $photoDir): Response
  16. {

创建相应的模板:

templates/conference/header.html.twig

  1. <ul>
  2. {% for conference in conferences %}
  3. <li><a href="{{ path('conference', { slug: conference.slug }) }}">{{ conference }}</a></li>
  4. {% endfor %}
  5. </ul>

点击 /conference_header 来检查一切是否正常工作。

揭秘戏法的时候到了!通过更新 Twig 布局来调用我们刚刚创建的控制器:

patch_file

  1. --- a/templates/base.html.twig
  2. +++ b/templates/base.html.twig
  3. @@ -8,11 +8,7 @@
  4. <body>
  5. <header>
  6. <h1><a href="{{ path('homepage') }}">Guestbook</a></h1>
  7. - <ul>
  8. - {% for conference in conferences %}
  9. - <li><a href="{{ path('conference', { slug: conference.slug }) }}">{{ conference }}</a></li>
  10. - {% endfor %}
  11. - </ul>
  12. + {{ render(path('conference_header')) }}
  13. <hr />
  14. </header>
  15. {% block body %}{% endblock %}

好了。刷新下页面,网站的显示内容没有变化。

小技巧

使用 Symfony 分析器的 “Request / Response” 面板来更多了解主请求和子请求。

现在,每次你在浏览器里打开一个页面,会执行两个 HTTP 请求,一个是针对页头,另一个是针对页面主体。你把性能变得更差了。恭喜你!

现在,针对会议页头的 HTTP 调用是在 Symfony 内部完成的,所以不会产生 HTTP 的回路。这也意味着它没有办法从 HTTP 缓存头中获益。

用 ESI 把这个调用转换成一个“真正”的 HTTP 调用。

首先,启用 ESI 支持:

patch_file

  1. --- a/config/packages/framework.yaml
  2. +++ b/config/packages/framework.yaml
  3. @@ -11,7 +11,7 @@ framework:
  4. cookie_secure: auto
  5. cookie_samesite: lax
  6. - #esi: true
  7. + esi: true
  8. #fragments: true
  9. php_errors:
  10. log: true

然后,使用 render_esi 来代替 render

patch_file

  1. --- a/templates/base.html.twig
  2. +++ b/templates/base.html.twig
  3. @@ -10,7 +10,7 @@
  4. <body>
  5. <header>
  6. <h1><a href="{{ path('homepage') }}">Guestbook</a></h1>
  7. - {{ render(path('conference_header')) }}
  8. + {{ render_esi(path('conference_header')) }}
  9. <hr />
  10. </header>
  11. {% block body %}{% endblock %}

如果 Symfony 检测到一个会处理 ESI 的反向代理,它就会自动启用对它的支持(如果没有检测到,它就会回退到同步渲染子请求)。

由于 Symfony 的反向代理的确支持 ESI,我们来查看下日志(先清空缓存,请看下面的“清理缓存”):

  1. $ curl -s -I -X GET https://127.0.0.1:8000/
  1. HTTP/2 200
  2. age: 0
  3. cache-control: must-revalidate, no-cache, private
  4. content-type: text/html; charset=UTF-8
  5. date: Mon, 28 Oct 2019 08:20:05 GMT
  6. expires: Mon, 28 Oct 2019 08:20:05 GMT
  7. x-content-digest: en4dd846a34dcd757eb9fd277f43220effd28c00e4117bed41af7f85700eb07f2c
  8. x-debug-token: 719a83
  9. x-debug-token-link: https://127.0.0.1:8000/_profiler/719a83
  10. x-robots-tag: noindex
  11. x-symfony-cache: GET /: miss, store; GET /conference_header: miss
  12. content-length: 50978

刷新几次:/ 的应答被缓存了,/conference_header 没有被缓存。我们已经取得了很好的成果:总的页面在缓存中,但有一部分仍然是动态的。

但这仍不是我们想要的。我们来把 /conference_header 缓存一小时,并且独立于其它部分:

patch_file

  1. --- a/src/Controller/ConferenceController.php
  2. +++ b/src/Controller/ConferenceController.php
  3. @@ -44,9 +44,12 @@ class ConferenceController extends AbstractController
  4. #[Route('/conference_header', name: 'conference_header')]
  5. public function conferenceHeader(ConferenceRepository $conferenceRepository): Response
  6. {
  7. - return new Response($this->twig->render('conference/header.html.twig', [
  8. + $response = new Response($this->twig->render('conference/header.html.twig', [
  9. 'conferences' => $conferenceRepository->findAll(),
  10. ]));
  11. + $response->setSharedMaxAge(3600);
  12. +
  13. + return $response;
  14. }
  15. #[Route('/conference/{slug}', name: 'conference')]

现在两个请求都被缓存了:

  1. $ curl -s -I -X GET https://127.0.0.1:8000/
  1. HTTP/2 200
  2. age: 613
  3. cache-control: public, s-maxage=3600
  4. content-type: text/html; charset=UTF-8
  5. date: Mon, 28 Oct 2019 07:31:24 GMT
  6. x-content-digest: en15216b0803c7851d3d07071473c9f6a3a3360c6a83ccb0e550b35d5bc484bbd2
  7. x-debug-token: cfb0e9
  8. x-debug-token-link: https://127.0.0.1:8000/_profiler/cfb0e9
  9. x-robots-tag: noindex
  10. x-symfony-cache: GET /: fresh; GET /conference_header: fresh
  11. content-length: 50978

x-symfony-cache 头包含两个元素:/ 主请求和一个子请求(conference_header 这个 ESI)。两者都在缓存中(fresh)。

主页面和它的 ESI 可以采用不同的缓存策略。如果我们有一个”关于“页面,我们可能想要在缓存中让它存放一星期的时间,但仍然让页头每小时更新一次。

移除事件监听器,我们不再需要它了:

  1. $ rm src/EventSubscriber/TwigEventSubscriber.php

为测试而清空 HTTP 缓存

增加了缓存层之后,在浏览器中或用一些自动化测试手段来测试网站变得更困难一些了。

你能通过移除 var/cache/dev/http_cache/ 目录来手工清除所有 HTTP 缓存:

  1. $ rm -rf var/cache/dev/http_cache/

如果你只是想让一部分 URL 的缓存失效,或者你想要在功能测试中让缓存失效,那这个策略就不太可行。让我们来增加一个小的管理员专用的 HTTP 地址,用来让某些 URL 的缓存失效:

patch_file

  1. --- a/src/Controller/AdminController.php
  2. +++ b/src/Controller/AdminController.php
  3. @@ -6,8 +6,10 @@ use App\Entity\Comment;
  4. use App\Message\CommentMessage;
  5. use Doctrine\ORM\EntityManagerInterface;
  6. use Symfony\Bundle\FrameworkBundle\Controller\AbstractController;
  7. +use Symfony\Bundle\FrameworkBundle\HttpCache\HttpCache;
  8. use Symfony\Component\HttpFoundation\Request;
  9. use Symfony\Component\HttpFoundation\Response;
  10. +use Symfony\Component\HttpKernel\KernelInterface;
  11. use Symfony\Component\Messenger\MessageBusInterface;
  12. use Symfony\Component\Routing\Annotation\Route;
  13. use Symfony\Component\Workflow\Registry;
  14. @@ -52,4 +54,17 @@ class AdminController extends AbstractController
  15. 'comment' => $comment,
  16. ]);
  17. }
  18. +
  19. + #[Route('/admin/http-cache/{uri<.*>}', methods: ['PURGE'])]
  20. + public function purgeHttpCache(KernelInterface $kernel, Request $request, string $uri): Response
  21. + {
  22. + if ('prod' === $kernel->getEnvironment()) {
  23. + return new Response('KO', 400);
  24. + }
  25. +
  26. + $store = (new class($kernel) extends HttpCache {})->getStore();
  27. + $store->purge($request->getSchemeAndHttpHost().'/'.$uri);
  28. +
  29. + return new Response('Done');
  30. + }
  31. }

新的控制器被限制为只能用 HTTP 的 PURGE 方法访问。这个方法并不是 HTTP 标准中的,但被广泛用于让缓存失效。

默认情况下,路由参数里不能包含 / 字符,因为它是用来为 URL 分段的。但在最后一个路由参数里,你可以覆盖这个限制,比如在 uri 参数里,你可以设置自己的需求匹配模式(.*)。

我们获得 HttpCache 实例的方式看上去也有点奇怪;我们在用一个匿名函数,因为无法访问“真正”的类。 HttpCache 的实例包含了真正的内核,而内核并不知道这个缓存层的存在,它也不应该知道。

用下面的 cURL 命令来让首页和会议页头的缓存失效:

  1. $ curl -I -X PURGE -u admin:admin `symfony var:export SYMFONY_PROJECT_DEFAULT_ROUTE_URL`/admin/http-cache/
  2. $ curl -I -X PURGE -u admin:admin `symfony var:export SYMFONY_PROJECT_DEFAULT_ROUTE_URL`/admin/http-cache/conference_header

symfony var:export SYMFONY_PROJECT_DEFAULT_ROUTE_URL 子命令会返回本地 web 服务器的当前 URL。

注解

因为代码不会引用这个控制器,所以它没有路由名。

为相似的路由加上前缀并归为一组

管理后台控制器里的两个路由都有相同的 /admin 前缀。重构这些路由,改为在类上设置这个前缀,而不是在所有路由上重复它:

patch_file

  1. --- a/src/Controller/AdminController.php
  2. +++ b/src/Controller/AdminController.php
  3. @@ -15,6 +15,7 @@ use Symfony\Component\Routing\Annotation\Route;
  4. use Symfony\Component\Workflow\Registry;
  5. use Twig\Environment;
  6. +#[Route('/admin')]
  7. class AdminController extends AbstractController
  8. {
  9. private $twig;
  10. @@ -28,7 +29,7 @@ class AdminController extends AbstractController
  11. $this->bus = $bus;
  12. }
  13. - #[Route('/admin/comment/review/{id}', name: 'review_comment')]
  14. + #[Route('/comment/review/{id}', name: 'review_comment')]
  15. public function reviewComment(Request $request, Comment $comment, Registry $registry): Response
  16. {
  17. $accepted = !$request->query->get('reject');
  18. @@ -55,7 +56,7 @@ class AdminController extends AbstractController
  19. ]);
  20. }
  21. - #[Route('/admin/http-cache/{uri<.*>}', methods: ['PURGE'])]
  22. + #[Route('/http-cache/{uri<.*>}', methods: ['PURGE'])]
  23. public function purgeHttpCache(KernelInterface $kernel, Request $request, string $uri): Response
  24. {
  25. if ('prod' === $kernel->getEnvironment()) {

缓存 CPU/内存密集型的操作

在这个网站上,我们没有 CPU 或内存密集型的算法。为了讨论下”本地缓存“,我们来创建一个命令,它会展示我们当前的工作步骤(更准确地说,就是在当前的 Git 提交时附带的 Git 标签)。

Symfony 的 Process 组件可以用来运行一个命令,并且获得命令的输出结果(标准输出和错误输出);我们来安装它:

  1. $ symfony composer req process

实现这个命令:

src/Command/StepInfoCommand.php

  1. namespace App\Command;
  2. use Symfony\Component\Console\Command\Command;
  3. use Symfony\Component\Console\Input\InputInterface;
  4. use Symfony\Component\Console\Output\OutputInterface;
  5. use Symfony\Component\Process\Process;
  6. class StepInfoCommand extends Command
  7. {
  8. protected static $defaultName = 'app:step:info';
  9. protected function execute(InputInterface $input, OutputInterface $output): int
  10. {
  11. $process = new Process(['git', 'tag', '-l', '--points-at', 'HEAD']);
  12. $process->mustRun();
  13. $output->write($process->getOutput());
  14. return 0;
  15. }
  16. }

注解

你也可以用 make:command 来新建这个命令:

  1. $ symfony console make:command app:step:info

如果你想要把输出的内容缓存几分钟,那要怎么做?使用 Symfony 缓存:

  1. $ symfony composer req cache

用缓存逻辑包装这段代码:

patch_file

  1. --- a/src/Command/StepInfoCommand.php
  2. +++ b/src/Command/StepInfoCommand.php
  3. @@ -6,16 +6,31 @@ use Symfony\Component\Console\Command\Command;
  4. use Symfony\Component\Console\Input\InputInterface;
  5. use Symfony\Component\Console\Output\OutputInterface;
  6. use Symfony\Component\Process\Process;
  7. +use Symfony\Contracts\Cache\CacheInterface;
  8. class StepInfoCommand extends Command
  9. {
  10. protected static $defaultName = 'app:step:info';
  11. + private $cache;
  12. +
  13. + public function __construct(CacheInterface $cache)
  14. + {
  15. + $this->cache = $cache;
  16. +
  17. + parent::__construct();
  18. + }
  19. +
  20. protected function execute(InputInterface $input, OutputInterface $output): int
  21. {
  22. - $process = new Process(['git', 'tag', '-l', '--points-at', 'HEAD']);
  23. - $process->mustRun();
  24. - $output->write($process->getOutput());
  25. + $step = $this->cache->get('app.current_step', function ($item) {
  26. + $process = new Process(['git', 'tag', '-l', '--points-at', 'HEAD']);
  27. + $process->mustRun();
  28. + $item->expiresAfter(30);
  29. +
  30. + return $process->getOutput();
  31. + });
  32. + $output->writeln($step);
  33. return 0;
  34. }

现在,只有当 app.current_step 项没有被缓存时,那个命令才会执行。

分析并比较性能

绝不要盲目地增加缓存。记住,增加一些缓存就增加了一层复杂度。而且因为我们往往猜不准什么会变快什么会变慢,所以我们可能最终会发现缓存反而让应用变慢了。

总要去衡量缓存带来的性能影响,可以使用类似 Blackfire 的分析工具。

参考关于“性能”章节的内容来更多地了解如何在部署前使用 Blackfire 测试代码。

在生产环境中配置反向代理缓存

不要在生产环境中使用 Symfony 的反向代理。总是优先选用你平台上类似 Varnish 的反向代理,或者选用商业 CDN。

在 SymfonyCloud 服务中加入 Varnish:

patch_file

  1. --- a/.symfony/services.yaml
  2. +++ b/.symfony/services.yaml
  3. @@ -2,3 +2,12 @@ db:
  4. type: postgresql:13
  5. disk: 1024
  6. size: S
  7. +
  8. +varnish:
  9. + type: varnish:6.0
  10. + relationships:
  11. + application: 'app:http'
  12. + configuration:
  13. + vcl: !include
  14. + type: string
  15. + path: config.vcl

用 Varnish 作为路由的主入口:

patch_file

  1. --- a/.symfony/routes.yaml
  2. +++ b/.symfony/routes.yaml
  3. @@ -1,2 +1,2 @@
  4. -"https://{all}/": { type: upstream, upstream: "app:http" }
  5. +"https://{all}/": { type: upstream, upstream: "varnish:http", cache: { enabled: false } }
  6. "http://{all}/": { type: redirect, to: "https://{all}/" }

最后,新建一个 config.vcl 文件来配置 Varnish:

.symfony/config.vcl

  1. sub vcl_recv {
  2. set req.backend_hint = application.backend();
  3. }

在 Varnish 上启用 ESI 支持

需要为每个请求显式启用 Varnish 上的 ESI 支持。为了使它具有通用性,Symfony 使用标准的 Surrogate-CapabilitySurrogate-Control 头来协商 ESI 支持:

.symfony/config.vcl

  1. sub vcl_recv {
  2. set req.backend_hint = application.backend();
  3. set req.http.Surrogate-Capability = "abc=ESI/1.0";
  4. }
  5. sub vcl_backend_response {
  6. if (beresp.http.Surrogate-Control ~ "ESI/1.0") {
  7. unset beresp.http.Surrogate-Control;
  8. set beresp.do_esi = true;
  9. }
  10. }

清理 Varnish 缓存

在生产环境中很可能永远不需要使缓存失效,除非是为了处理紧急情况,或者可能是在非 master 分支上。如果你需要经常去清理缓存,它很可能意味着你的缓存策略需要调整(减少缓存有效时间,或者是用验证策略代替过期策略)。

不管怎样,我们来看下如何配置 Varnish 的缓存失效:

patch_file

  1. --- a/.symfony/config.vcl
  2. +++ b/.symfony/config.vcl
  3. @@ -1,6 +1,13 @@
  4. sub vcl_recv {
  5. set req.backend_hint = application.backend();
  6. set req.http.Surrogate-Capability = "abc=ESI/1.0";
  7. +
  8. + if (req.method == "PURGE") {
  9. + if (req.http.x-purge-token != "PURGE_NOW") {
  10. + return(synth(405));
  11. + }
  12. + return (purge);
  13. + }
  14. }
  15. sub vcl_backend_response {

在真实场景下,你很可能会根据IP来限制访问,Varnish 文档 里有这方面的介绍。

现在清理一些 URL 缓存:

  1. $ curl -X PURGE -H 'x-purge-token PURGE_NOW' `symfony env:urls --first`
  2. $ curl -X PURGE -H 'x-purge-token PURGE_NOW' `symfony env:urls --first`conference_header

这些 URL 看起来有点奇怪,因为 env:urls 返回的URL已经以 / 结尾了。

深入学习


This work, including the code samples, is licensed under a Creative Commons BY-NC-SA 4.0 license.