1. 网页截图

在这篇文章中,我们将研究如何利用Chrome的调试协议来加载网页并截图。通过一个名为的程序包chromedp,一切都可以实现,该程序包使我们可以通过Go代码控制Chrome实例。您还需要安装Chrome或使用类似于chrome/headless-shellDocker映像的工具。

我们将代码中的过程分为:

  • 启动Chrome
  • 运行任务:例如加载网页并截图
  • 将屏幕截图保存到文件
  1. package main
  2. import (
  3. "context"
  4. "io/ioutil"
  5. "log"
  6. "github.com/chromedp/cdproto/page"
  7. "github.com/chromedp/chromedp"
  8. )
  9. func main() {
  10. // Start Chrome
  11. // Remove the 2nd param if you don't need debug information logged
  12. ctx, cancel := chromedp.NewContext(context.Background(), chromedp.WithDebugf(log.Printf))
  13. defer cancel()
  14. url := "https://golangcode.com/"
  15. filename := "golangcode.png"
  16. // Run Tasks
  17. // List of actions to run in sequence (which also fills our image buffer)
  18. var imageBuf []byte
  19. if err := chromedp.Run(ctx, ScreenshotTasks(url, &imageBuf)); err != nil {
  20. log.Fatal(err)
  21. }
  22. // Write our image to file
  23. if err := ioutil.WriteFile(filename, imageBuf, 0644); err != nil {
  24. log.Fatal(err)
  25. }
  26. }
  27. func ScreenshotTasks(url string, imageBuf *[]byte) chromedp.Tasks {
  28. return chromedp.Tasks{
  29. chromedp.Navigate(url),
  30. chromedp.ActionFunc(func(ctx context.Context) (err error) {
  31. *imageBuf, err = page.CaptureScreenshot().WithQuality(90).Do(ctx)
  32. return err
  33. }),
  34. }
  35. }

topgoer

另外,如果您想将页面另存为pdf而不是图像,则可以将CaptureScreenshot行替换为以下内容:

  1. *imageBuf, _, err = page.PrintToPDF().WithPrintBackground(false).Do(ctx)