服务

使用“服务”菜单

“服务”页面为本地 DC/OS Marathon 实例提供了完整的功能界面。其全面展示正在运行的所有服务。您可以按健康状况、状态或服务名称筛选服务。

Services

图 1 - 服务页面

筛选显示内容

默认显示所有服务,并按服务名称排序。也可以按运行状况、版本、区域、实例、CPU、磁盘空间或 GPU 的使用情况对服务进行排序。

名称说明
名称服务的 DC/OS 服务名称
Status服务状态。请参阅下表中的详细信息。
版本服务版本
地区服务分域
实例服务实例的数量
CPU使用的 CPU 数量
内存使用的内存量
磁盘使用的磁盘空间量
GPU使用的 GPU 数量

要为显示内容显示筛选器,请单击搜索框中的向下箭头。

排序菜单

图 2 -“排序”菜单

服务状态

状态描述
运行服务报告为运行,且没有报告为部署或恢复的实例。
部署当您请求更改服务时,DC/OS 会执行尚未完成的必要操作。如果服务难以进入运行状态,就会显示警告图标。这表示服务正在等待其运行所需的资源邀约,或者短时间内有过多任务失败。可以从 调试 选项卡获取更多信息。
恢复当 DC/OS 请求对服务进行更改时,实例都将被关闭并启动新实例。与部署相似,DC/OS 正在执行规定操作,但尚未完成。
已停止目标实例为 0 且运行任务计数为 0 的服务。此状态之前在 UI 中被称为“暂停”。

SDK 服务状态

基于 DC/OS SDK 的调度器任务,利用的是 Mesos 本地检查,以便提供比上述 服务状态 更详细的有关其状态的信息。这些状态级别特定于基于 SDK 的调度器及其生命周期。

状态描述
正在初始化调度程序正在初始化。
运行所有受监控计划均已完成。
创建服务时出错调度程序在创建服务时遇到错误。
部署(等待资源)一个或多个受监控计划正在部署(等待资源)。
部署一个或多个受监控计划正在部署。
部署(等待用户输入)一个或多个受监控计划在等待用户输入。
已降级(等待资源)一个或多个受监控计划已降级(等待资源)。
已降级(正在恢复)一个或多个受监控计划已降级(正在恢复)。
备份一个或多个受监控的备份计划正在进行中。
恢复一个或多个受监控的恢复计划正在进行中。
服务不可用调度程序遇到一个或多个受监控计划的错误。

选项卡

单击服务名称,打开“服务实例”页面。“服务实例”页面将有关服务的信息组织在五个选项卡下方。每个选项卡都列出了关于服务配置和性能的信息。

Instances

图 3 - 服务实例

选项卡描述
任务对于每个任务,还有关于其分区、分域、状态、运行状况以及最后更新时间的信息。单击任务以查看其完整配置、工作目录和日志。
配置服务和网络配置变量。
调试显示任务统计信息以帮助您排除群集问题。
端点服务配置变量,例如容器镜像、容器运行时和高级网络设置。
计划显示服务的所有部署计划,以便跟踪当前运行或已完成服务的状态。下拉菜单可让您在计划之间切换。此选项卡可能不会显示在所有服务实例中,具体取决于服务配置。

对于带有 UI 的服务,将鼠标悬停在服务名称上并单击 open service 查看服务。您可以在 访问 Mesos UI。<hostname>/mesos.

使用 UI 进行调试

服务 > 调试 选项卡显示上次更改、任务故障以及其他状态消息,这有助于调试服务部署的问题。

在下图中,Marathon 无法启动服务;DC/OS 显示警告消息,然后一条消息表示错误已清除,服务现在正在启动。

故障警告

图 4 - 显示警告的“调试”选项卡

有关部署服务的更多信息,请参阅 部署服务和 Pod 文档。