Kubernetes 指标参考

Kubernetes 组件导出的指标数据的详细信息。

指标 (v1.32)

此页面详细介绍了不同的 Kubernetes 组件导出的指标。您可以使用 HTTP 抓取来查询这些组件的指标端点,并以 Prometheus 格式获取当前的指标数据。

稳定的 Kubernetes 指标列表

稳定的指标遵循严格的 API 约定,在其生命周期内,不能从稳定的指标中添加或删除标签。

apiserver_admission_controller_admission_duration_seconds
准入控制器延迟直方图,以秒为单位,按名称标识,并为每个操作以及 API 资源和类型(验证或允许)进行分解。
  • 稳定
  • 直方图
  • nameoperationrejectedtype
apiserver_admission_step_admission_duration_seconds
准入子步骤延迟直方图,以秒为单位,为每个操作以及 API 资源和步骤类型(验证或允许)分解。
  • 稳定
  • 直方图
  • operationrejectedtype
apiserver_admission_webhook_admission_duration_seconds
准入 Webhook 延迟直方图,以秒为单位,按名称标识,并为每个操作以及 API 资源和类型(验证或允许)进行分解。
  • 稳定
  • 直方图
  • nameoperationrejectedtype
apiserver_current_inflight_requests
在最后一秒内,此 apiserver 每个请求类型的当前使用中的 inflight 请求限制的最大数量。
  • 稳定
  • 仪表盘
  • 请求类型
apiserver_longrunning_requests
所有活动的长时间运行的 apiserver 请求的仪表盘,按动词、组、版本、资源、范围和组件进行分解。并非所有请求都以这种方式跟踪。
  • 稳定
  • 仪表盘
  • componentgroupresourcescopesubresourceverbversion
apiserver_request_duration_seconds
每个动词、dry run 值、组、版本、资源、子资源、范围和组件的响应延迟分布,以秒为单位。
  • 稳定
  • 直方图
  • componentdry_rungroupresourcescopesubresourceverbversion
apiserver_request_total
apiserver 请求的计数器,为每个动词、dry run 值、组、版本、资源、范围、组件和 HTTP 响应代码分解。
  • 稳定
  • 计数器
  • codecomponentdry_rungroupresourcescopesubresourceverbversion
apiserver_requested_deprecated_apis
已请求的已弃用 API 的仪表盘,按 API 组、版本、资源、子资源和 removed_release 分解。
  • 稳定
  • 仪表盘
  • groupremoved_releaseresourcesubresourceversion
apiserver_response_sizes
每个组、版本、动词、资源、子资源、范围和组件的响应大小分布,以字节为单位。
  • 稳定
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
apiserver_storage_objects
上次检查时存储对象的数量,按类型分割。如果出现获取错误,该值将为 -1。
  • 稳定
  • 仪表盘
  • 资源
apiserver_storage_size_bytes
以字节为单位,实际分配的存储数据库文件大小。
  • 稳定
  • 自定义
  • 存储集群 ID
container_cpu_usage_seconds_total
容器消耗的累积 CPU 时间,以核心秒为单位
  • 稳定
  • 自定义
  • containerpodnamespace
container_memory_working_set_bytes
容器的当前工作集,以字节为单位
  • 稳定
  • 自定义
  • containerpodnamespace
container_start_time_seconds
自 Unix 纪元以来,容器的启动时间,以秒为单位
  • 稳定
  • 自定义
  • containerpodnamespace
cronjob_controller_job_creation_skew_duration_seconds
计划运行 CronJob 的时间与创建相应 Job 的时间之间的间隔
  • 稳定
  • 直方图
job_controller_job_pods_finished_total
完全跟踪的已完成 Pod 的数量
  • 稳定
  • 计数器
  • completion_moderesult
job_controller_job_sync_duration_seconds
同步 Job 所需的时间
  • 稳定
  • 直方图
  • actioncompletion_moderesult
job_controller_job_syncs_total
Job 同步的数量
  • 稳定
  • 计数器
  • actioncompletion_moderesult
job_controller_jobs_finished_total
已完成 Job 的数量
  • 稳定
  • 计数器
  • completion_modereasonresult
kube_pod_resource_limit
集群上工作负载的资源限制,按 Pod 分解。这显示了调度器和 Kubelet 期望每个 Pod 使用的资源以及资源的单位(如果有)。
  • 稳定
  • 自定义
  • namespacepodnodeschedulerpriorityresourceunit
kube_pod_resource_request
集群上工作负载请求的资源,按 Pod 分解。这显示了调度器和 Kubelet 期望每个 Pod 使用的资源以及资源的单位(如果有)。
  • 稳定
  • 自定义
  • namespacepodnodeschedulerpriorityresourceunit
kubernetes_healthcheck
此指标记录单个运行状况检查的结果。
  • 稳定
  • 仪表盘
  • nametype
kubernetes_healthchecks_total
此指标记录所有运行状况检查的结果。
  • 稳定
  • 计数器
  • namestatustype
node_collector_evictions_total
自当前 NodeController 实例启动以来发生的节点驱逐次数。
  • 稳定
  • 计数器
  • 区域
node_cpu_usage_seconds_total
节点消耗的累积 CPU 时间,以核心秒为单位
  • 稳定
  • 自定义
node_memory_working_set_bytes
节点的当前工作集,以字节为单位
  • 稳定
  • 自定义
pod_cpu_usage_seconds_total
Pod 消耗的累积 CPU 时间,以核心秒为单位
  • 稳定
  • 自定义
  • podnamespace
pod_memory_working_set_bytes
Pod 的当前工作集,以字节为单位
  • 稳定
  • 自定义
  • podnamespace
resource_scrape_error
如果在获取容器指标时出现错误,则为 1,否则为 0
  • 稳定
  • 自定义
scheduler_framework_extension_point_duration_seconds
运行特定扩展点的所有插件的延迟。
  • 稳定
  • 直方图
  • extension_pointprofilestatus
scheduler_pending_pods
按队列类型划分的挂起 Pod 的数量。 “active” 表示 activeQ 中 Pod 的数量;“backoff” 表示 backoffQ 中 Pod 的数量;“unschedulable” 表示调度程序尝试调度但失败的 unschedulablePods 中 Pod 的数量; “gated” 是调度程序从未尝试调度的不在调度范围内的 pod 的数量,因为它们是 gated 状态。
  • 稳定
  • 仪表盘
  • 队列
scheduler_pod_scheduling_attempts
成功调度 Pod 的尝试次数。
  • 稳定
  • 直方图
scheduler_pod_scheduling_duration_seconds
Pod 被调度的端到端延迟,可能包括多次调度尝试。
  • 稳定
  • 直方图
  • 尝试次数
  • 1.29.0
scheduler_preemption_attempts_total
到目前为止集群中的总抢占尝试次数
  • 稳定
  • 计数器
scheduler_preemption_victims
选择的抢占受害者数量
  • 稳定
  • 直方图
scheduler_queue_incoming_pods_total
按事件和队列类型添加到调度队列的 Pod 数量。
  • 稳定
  • 计数器
  • eventqueue
scheduler_schedule_attempts_total
按结果划分的调度 Pod 的尝试次数。“unschedulable” 表示无法调度 Pod,而 “error” 表示内部调度程序问题。
  • 稳定
  • 计数器
  • profileresult
scheduler_scheduling_attempt_duration_seconds
调度尝试延迟,以秒为单位(调度算法 + 绑定)
  • 稳定
  • 直方图
  • profileresult

Beta Kubernetes 指标列表

Beta 指标的 API 约定比其稳定版本宽松。在 Beta 指标的生命周期内,不能删除标签,但是可以在指标处于 Beta 阶段时添加标签。这确保了 Beta 指标能够兼容现有的仪表板和告警,同时允许在未来进行修改。

apiserver_cel_compilation_duration_seconds
CEL 编译时间,以秒为单位。
  • BETA
  • 直方图
apiserver_cel_evaluation_duration_seconds
CEL 评估时间,以秒为单位。
  • BETA
  • 直方图
apiserver_flowcontrol_current_executing_requests
API 优先级和公平性子系统中,处于初始执行阶段(对于 WATCH)或任何执行阶段(对于非 WATCH)的请求数量
  • BETA
  • 仪表盘
  • flow_schemapriority_level
apiserver_flowcontrol_current_executing_seats
API 优先级和公平性子系统中,当前正在执行的请求(对于 WATCH 是初始阶段,否则是任何阶段)所占用的并发数(席位数)
  • BETA
  • 仪表盘
  • flow_schemapriority_level
apiserver_flowcontrol_current_inqueue_requests
API 优先级和公平性子系统中,当前在队列中等待的请求数量
  • BETA
  • 仪表盘
  • flow_schemapriority_level
apiserver_flowcontrol_dispatched_requests_total
API 优先级和公平性子系统执行的请求总数
  • BETA
  • 计数器
  • flow_schemapriority_level
apiserver_flowcontrol_nominal_limit_seats
为每个优先级配置的额定执行席位数
  • BETA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_rejected_requests_total
被 API 优先级和公平性子系统拒绝的请求总数
  • BETA
  • 计数器
  • flow_schemapriority_levelreason
apiserver_flowcontrol_request_wait_duration_seconds
请求在其队列中等待的时间长度
  • BETA
  • 直方图
  • executeflow_schemapriority_level
apiserver_validating_admission_policy_check_duration_seconds
单个验证表达式的验证准入延迟,以秒为单位,按策略标记,并进一步包括绑定和执行操作。
  • BETA
  • 直方图
  • enforcement_actionerror_typepolicypolicy_binding
apiserver_validating_admission_policy_check_total
验证准入策略检查总数,按策略标记,并进一步通过绑定和执行操作进行标识。
  • BETA
  • 计数器
  • enforcement_actionerror_typepolicypolicy_binding
disabled_metrics_total
已禁用指标的计数。
  • BETA
  • 计数器
hidden_metrics_total
隐藏指标的计数。
  • BETA
  • 计数器
kubernetes_feature_enabled
此指标记录有关 Kubernetes 功能的阶段和启用状态的数据。
  • BETA
  • 仪表盘
  • namestage
registered_metrics_total
按稳定级别和弃用版本划分的已注册指标的计数。
  • BETA
  • 计数器
  • deprecated_versionstability_level
scheduler_pod_scheduling_sli_duration_seconds
Pod 从进入调度队列到可能涉及多次调度尝试的端到端调度延迟。
  • BETA
  • 直方图
  • 尝试次数

Alpha Kubernetes 指标列表

Alpha 指标没有任何 API 保证。这些指标必须由您自行承担风险使用,后续版本的 Kubernetes 可能会完全删除这些指标,或者以破坏现有仪表板和告警的方式改变 API。

aggregator_discovery_aggregation_count_total
发现聚合的次数计数器
  • ALPHA
  • 计数器
aggregator_openapi_v2_regeneration_count
按导致 APIService 名称和原因划分的 OpenAPI v2 规范重新生成计数器。
  • ALPHA
  • 计数器
  • apiservicereason
aggregator_openapi_v2_regeneration_duration
OpenAPI v2 规范重新生成持续时间的指标,以秒为单位。
  • ALPHA
  • 仪表盘
  • reason
aggregator_unavailable_apiservice
按 APIService 名称划分的标记为不可用的 APIService 的指标。
  • ALPHA
  • 自定义
  • name
aggregator_unavailable_apiservice_total
按 APIService 名称和原因划分的标记为不可用的 APIService 的计数器。
  • ALPHA
  • 计数器
  • namereason
apiextensions_apiserver_validation_ratcheting_seconds
在 UPDATE 期间,出于 CRDValidationRatcheting 的目的,比较新旧版本的时间,以秒为单位。
  • ALPHA
  • 直方图
apiextensions_openapi_v2_regeneration_count
按导致 CRD 名称和原因划分的 OpenAPI v2 规范重新生成计数器。
  • ALPHA
  • 计数器
  • crdreason
apiextensions_openapi_v3_regeneration_count
按组、版本、导致 CRD 和原因划分的 OpenAPI v3 规范重新生成计数器。
  • ALPHA
  • 计数器
  • crdgroupreasonversion
apiserver_admission_match_condition_evaluation_errors_total
准入匹配条件评估错误计数,由包含匹配条件的资源的名称标识,并为每个包含 matchConditions 的类型(webhook 或策略)、操作和准入类型(验证或准入)分别列出。
  • ALPHA
  • 计数器
  • kindnameoperationtype
apiserver_admission_match_condition_evaluation_seconds
准入匹配条件评估时间,以秒为单位,由名称标识,并为每个包含 matchConditions 的类型(webhook 或策略)、操作和类型(验证或准入)分别列出。
  • ALPHA
  • 直方图
  • kindnameoperationtype
apiserver_admission_match_condition_exclusions_total
准入匹配条件评估排除计数,由包含匹配条件的资源的名称标识,并为每个包含 matchConditions 的类型(webhook 或策略)、操作和准入类型(验证或准入)分别列出。
  • ALPHA
  • 计数器
  • kindnameoperationtype
apiserver_admission_step_admission_duration_seconds_summary
准入子步骤延迟摘要,以秒为单位,为每个操作、API 资源和步骤类型(验证或准入)分别列出。
  • ALPHA
  • 摘要
  • operationrejectedtype
apiserver_admission_webhook_fail_open_count
准入 Webhook 失败打开计数,由名称标识,并为每个准入类型(验证或准入)分别列出。
  • ALPHA
  • 计数器
  • nametype
apiserver_admission_webhook_rejection_count
准入 Webhook 拒绝计数,由名称标识,并为每个准入类型(验证或准入)和操作分别列出。其他标签指定错误类型(如果发生错误,则为 calling_webhook_error 或 apiserver_internal_error;否则为 no_error),如果 Webhook 以 HTTP 状态代码拒绝请求,则可以选择指定一个非零的拒绝代码(当代码大于或等于 400 时,apiserver 将会遵守)。大于 600 的代码将被截断为 600,以保持指标基数有界。
  • ALPHA
  • 计数器
  • error_typenameoperationrejection_codetype
apiserver_admission_webhook_request_total
准入 Webhook 请求总数,由名称标识,并为每个准入类型(验证或准入)和操作分别列出。其他标签指定请求是否被拒绝以及 HTTP 状态代码。大于 600 的代码将被截断为 600,以保持指标基数有界。
  • ALPHA
  • 计数器
  • codenameoperationrejectedtype
apiserver_audit_error_total
未能正确审计的审计事件的计数器。插件标识受错误影响的插件。
  • ALPHA
  • 计数器
  • plugin
apiserver_audit_event_total
生成并发送到审计后端的审计事件的计数器。
  • ALPHA
  • 计数器
apiserver_audit_level_total
审计事件的策略级别的计数器(每个请求 1 个)。
  • ALPHA
  • 计数器
  • level
apiserver_audit_requests_rejected_total
由于审计日志记录后端出现错误而被拒绝的 apiserver 请求的计数器。
  • ALPHA
  • 计数器
apiserver_authentication_config_controller_automatic_reload_last_timestamp_seconds
按状态和 apiserver 标识划分的身份验证配置的最后一次自动重新加载的时间戳。
  • ALPHA
  • 仪表盘
  • apiserver_id_hashstatus
apiserver_authentication_config_controller_automatic_reloads_total
按状态和 apiserver 标识划分的身份验证配置的自动重新加载总数。
  • ALPHA
  • 计数器
  • apiserver_id_hashstatus
apiserver_authentication_jwt_authenticator_latency_seconds
jwt 身份验证操作的延迟,以秒为单位。这是仅用于缓存未命中时(即在缓存中未找到令牌时)身份验证令牌所花费的时间。
  • ALPHA
  • 直方图
  • jwt_issuer_hashresult
apiserver_authorization_config_controller_automatic_reload_last_timestamp_seconds
按状态和 apiserver 标识划分的授权配置的最后一次自动重新加载的时间戳。
  • ALPHA
  • 仪表盘
  • apiserver_id_hashstatus
apiserver_authorization_config_controller_automatic_reloads_total
按状态和 apiserver 标识划分的授权配置的自动重新加载总数。
  • ALPHA
  • 计数器
  • apiserver_id_hashstatus
apiserver_authorization_decisions_total
授权器做出的最终决策总数,按授权器类型、名称和决策划分。
  • ALPHA
  • 计数器
  • decisionnametype
apiserver_authorization_match_condition_evaluation_errors_total
当授权 Webhook 遇到匹配条件错误时,错误的总数按授权器类型和名称划分。
  • ALPHA
  • 计数器
  • nametype
apiserver_authorization_match_condition_evaluation_seconds
授权匹配条件评估时间,以秒为单位,按授权器类型和名称划分。
  • ALPHA
  • 直方图
  • nametype
apiserver_authorization_match_condition_exclusions_total
当因为匹配条件排除而跳过授权 Webhook 时,排除的总数。
  • ALPHA
  • 计数器
  • nametype
apiserver_authorization_webhook_duration_seconds
请求延迟,以秒为单位。
  • ALPHA
  • 直方图
  • nameresult
apiserver_authorization_webhook_evaluations_fail_open_total
由于 Webhook 超时或错误导致的 NoOpinion 结果。
  • ALPHA
  • 计数器
  • nameresult
apiserver_authorization_webhook_evaluations_total
授权 Webhook 的往返次数。
  • ALPHA
  • 计数器
  • nameresult
apiserver_cache_list_fetched_objects_total
在服务 LIST 请求的过程中,从监视缓存中读取的对象数量
  • ALPHA
  • 计数器
  • indexresource_prefix
apiserver_cache_list_returned_objects_total
从监视缓存为 LIST 请求返回的对象数量
  • ALPHA
  • 计数器
  • resource_prefix
apiserver_cache_list_total
从监视缓存服务的 LIST 请求的数量
  • ALPHA
  • 计数器
  • indexresource_prefix
apiserver_certificates_registry_csr_honored_duration_total
已颁发的 CSR 中,请求的持续时间被遵守的总数,按签名者划分(仅明确标识 kubernetes.io 签名者名称)
  • ALPHA
  • 计数器
  • signerName
apiserver_certificates_registry_csr_requested_duration_total
已颁发的 CSR 中,具有请求持续时间的总数,按签名者划分(仅明确标识 kubernetes.io 签名者名称)
  • ALPHA
  • 计数器
  • signerName
apiserver_client_certificate_expiration_seconds
用于身份验证请求的证书的剩余生命周期分布。
  • ALPHA
  • 直方图
apiserver_clusterip_repair_ip_errors_total
由修复循环检测到的 clusterips 错误数量,按错误类型细分:泄漏、修复、完整、超出范围、重复、未知、无效
  • ALPHA
  • 计数器
  • type
apiserver_clusterip_repair_reconcile_errors_total
clusterip 修复协调循环中的协调失败次数
  • ALPHA
  • 计数器
apiserver_conversion_webhook_duration_seconds
转换 Webhook 请求延迟
  • ALPHA
  • 直方图
  • failure_typeresult
apiserver_conversion_webhook_request_total
转换 Webhook 请求计数器,带有成功/失败和失败错误类型
  • ALPHA
  • 计数器
  • failure_typeresult
apiserver_crd_conversion_webhook_duration_seconds
CRD Webhook 转换持续时间,以秒为单位
  • ALPHA
  • 直方图
  • crd_namefrom_versionsucceededto_version
apiserver_current_inqueue_requests
在上一秒中,每个请求类型的此 apiserver 中排队的最大请求数量。
  • ALPHA
  • 仪表盘
  • 请求类型
apiserver_delegated_authn_request_duration_seconds
请求延迟,以秒为单位。按状态代码细分。
  • ALPHA
  • 直方图
  • code
apiserver_delegated_authn_request_total
按状态代码分区的 HTTP 请求数。
  • ALPHA
  • 计数器
  • code
apiserver_delegated_authz_request_duration_seconds
请求延迟,以秒为单位。按状态代码细分。
  • ALPHA
  • 直方图
  • code
apiserver_delegated_authz_request_total
按状态代码分区的 HTTP 请求数。
  • ALPHA
  • 计数器
  • code
apiserver_egress_dialer_dial_duration_seconds
拨号延迟直方图,以秒为单位,按协议(http-connect 或 grpc)、传输(tcp 或 uds)标记
  • ALPHA
  • 直方图
  • protocoltransport
apiserver_egress_dialer_dial_failure_count
拨号失败计数,按协议(http-connect 或 grpc)、传输(tcp 或 uds)和阶段(连接或代理)标记。阶段指示拨号失败的阶段
  • ALPHA
  • 计数器
  • protocolstagetransport
apiserver_egress_dialer_dial_start_total
拨号开始,按协议(http-connect 或 grpc)和传输(tcp 或 uds)标记。
  • ALPHA
  • 计数器
  • protocoltransport
apiserver_encryption_config_controller_automatic_reload_failures_total
按 apiserver 标识划分的加密配置的自动重新加载失败的总数。
  • ALPHA
  • 计数器
  • apiserver_id_hash
  • 1.30.0
apiserver_encryption_config_controller_automatic_reload_last_timestamp_seconds
按 apiserver 标识划分的最后一次成功或失败的加密配置自动重新加载的时间戳。
  • ALPHA
  • 仪表盘
  • apiserver_id_hashstatus
apiserver_encryption_config_controller_automatic_reload_success_total
按 apiserver 标识划分的加密配置的成功自动重新加载总数。
  • ALPHA
  • 计数器
  • apiserver_id_hash
  • 1.30.0
apiserver_encryption_config_controller_automatic_reloads_total
按 apiserver 标识划分的加密配置的重新加载成功和失败总数。
  • ALPHA
  • 计数器
  • apiserver_id_hashstatus
apiserver_envelope_encryption_dek_cache_fill_percent
当前缓存的 DEK 占用的缓存槽百分比。
  • ALPHA
  • 仪表盘
apiserver_envelope_encryption_dek_cache_inter_arrival_time_seconds
转换请求到达的间隔时间(秒)。
  • ALPHA
  • 直方图
  • transformation_type
apiserver_envelope_encryption_dek_source_cache_size
数据加密密钥(DEK)源缓存中的记录数。在重启时,此值是服务器将向 KMS 插件发出的解密 RPC 调用的次数的近似值。
  • ALPHA
  • 仪表盘
  • provider_name
apiserver_envelope_encryption_invalid_key_id_from_status_total
Status RPC 调用返回无效 keyID 的次数,按错误类型划分。
  • ALPHA
  • 计数器
  • errorprovider_name
apiserver_envelope_encryption_key_id_hash_last_timestamp_seconds
上次使用 keyID 的时间(秒)。
  • ALPHA
  • 仪表盘
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
apiserver_envelope_encryption_key_id_hash_status_last_timestamp_seconds
上次 Status RPC 调用返回 keyID 的时间(秒)。
  • ALPHA
  • 仪表盘
  • apiserver_id_hashkey_id_hashprovider_name
apiserver_envelope_encryption_key_id_hash_total
按转换类型、提供者和 apiserver 身份划分的 keyID 使用次数。
  • ALPHA
  • 计数器
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
apiserver_envelope_encryption_kms_operations_latency_seconds
KMS 操作持续时间,包括 gRPC 错误代码状态总数。
  • ALPHA
  • 直方图
  • grpc_status_codemethod_nameprovider_name
apiserver_externaljwt_fetch_keys_data_timestamp
外部签名器返回的上次成功 FetchKeys data_timestamp 值的 Unix 时间戳(秒)。
  • ALPHA
  • 仪表盘
apiserver_externaljwt_fetch_keys_request_total
同步受支持的 JWK 的总尝试次数。
  • ALPHA
  • 计数器
  • code
apiserver_externaljwt_fetch_keys_success_timestamp
上次成功 FetchKeys 请求的 Unix 时间戳(秒)。
  • ALPHA
  • 仪表盘
apiserver_externaljwt_request_duration_seconds
调用 external-jwt-signer 的请求持续时间和时间。
  • ALPHA
  • 直方图
  • codemethod
apiserver_externaljwt_sign_request_total
签名 JWT 的总尝试次数。
  • ALPHA
  • 计数器
  • code
apiserver_flowcontrol_current_inqueue_seats
API 优先级和公平子系统的队列中当前等待的席位数。
  • ALPHA
  • 仪表盘
  • flow_schemapriority_level
apiserver_flowcontrol_current_limit_seats
每个优先级级别可用的当前派生的执行席位数。
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_current_r
R(上次更改时间)
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_demand_seats
每个纳秒结束时对 (每个优先级级别可以使用的席位数) / (该级别的标称席位数) 的观测值。
  • ALPHA
  • TimingRatioHistogram
  • priority_level
apiserver_flowcontrol_demand_seats_average
在上次调整期间,demand_seats 的时间加权平均值。
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_demand_seats_high_watermark
在上次调整期间,demand_seats 的高水位线。
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_demand_seats_smoothed
平滑的席位需求。
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_demand_seats_stdev
在上次调整期间,demand_seats 的时间加权标准偏差。
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_dispatch_r
R(上次调度时间)
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_epoch_advance_total
队列集的进度表向后跳转的次数。
  • ALPHA
  • 计数器
  • priority_levelsuccess
apiserver_flowcontrol_latest_s
S(最近调度的请求)
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_lower_limit_seats
配置的每个优先级级别可用的执行席位数的下限。
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_next_discounted_s_bounds
队列中 S(最早等待请求) - 估计的进行中工作量的最小值和最大值。
  • ALPHA
  • 仪表盘
  • boundpriority_level
apiserver_flowcontrol_next_s_bounds
队列中 S(最早等待请求) 的最小值和最大值。
  • ALPHA
  • 仪表盘
  • boundpriority_level
apiserver_flowcontrol_priority_level_request_utilization
每个纳秒结束时,对(等待或处于任何执行阶段的请求数,占相关限制的比例)的观测值(但 WATCH 仅为初始阶段)。
  • ALPHA
  • TimingRatioHistogram
  • phasepriority_level
apiserver_flowcontrol_priority_level_seat_utilization
每个纳秒结束时,对任何执行阶段的席位利用率的观测值(但 WATCH 仅为初始阶段)。
  • ALPHA
  • TimingRatioHistogram
  • priority_level
  • phase:executing
apiserver_flowcontrol_read_vs_write_current_requests
每个纳秒结束时,对(等待或处于常规执行阶段的请求数,占相关限制的比例)的观测值。
  • ALPHA
  • TimingRatioHistogram
  • phaserequest_kind
apiserver_flowcontrol_request_concurrency_in_use
API 优先级和公平性子系统中,当前正在执行的请求(对于 WATCH 是初始阶段,否则是任何阶段)所占用的并发数(席位数)
  • ALPHA
  • 仪表盘
  • flow_schemapriority_level
  • 1.31.0
apiserver_flowcontrol_request_concurrency_limit
为每个优先级配置的额定执行席位数
  • ALPHA
  • 仪表盘
  • priority_level
  • 1.30.0
apiserver_flowcontrol_request_dispatch_no_accommodation_total
由于缺少可用席位而导致调度尝试失败的次数。
  • ALPHA
  • 计数器
  • flow_schemapriority_level
apiserver_flowcontrol_request_execution_seconds
API 优先级和公平子系统中请求执行的初始阶段(对于 WATCH)或任何阶段(对于非 WATCH)的持续时间。
  • ALPHA
  • 直方图
  • flow_schemapriority_leveltype
apiserver_flowcontrol_request_queue_length_after_enqueue
API 优先级和公平子系统中队列的长度,如每个请求在入队后所见。
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_flowcontrol_seat_fair_frac
分配给每个可以使用的优先级级别的服务器并发的公平比例。
  • ALPHA
  • 仪表盘
apiserver_flowcontrol_target_seats
席位分配目标。
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_upper_limit_seats
配置的每个优先级级别可用的执行席位数的上限。
  • ALPHA
  • 仪表盘
  • priority_level
apiserver_flowcontrol_watch_count_samples
API 优先级和公平中,针对变更请求的观察者计数。
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_flowcontrol_work_estimated_seats
API 优先级和公平中,与请求关联的估计席位数(初始和最终席位的最大值)。
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_init_events_total
按资源类型划分的 watch 缓存中处理的初始化事件计数器。
  • ALPHA
  • 计数器
  • 资源
apiserver_kube_aggregator_x509_insecure_sha1_total
计算向其服务证书中具有不安全 SHA1 签名的服务器发出的请求数,或由于不安全的 SHA1 签名导致的连接失败数(根据运行时环境,两者选一)。
  • ALPHA
  • 计数器
apiserver_kube_aggregator_x509_missing_san_total
计算向其服务证书中缺少 SAN 扩展的服务器发出的请求数,或由于缺少 x509 证书 SAN 扩展导致的连接失败数(根据运行时环境,两者选一)。
  • ALPHA
  • 计数器
apiserver_nodeport_repair_port_errors_total
按错误类型(泄露、修复、完全、超出范围、重复、未知)划分的修复循环在端口上检测到的错误数。
  • ALPHA
  • 计数器
  • type
apiserver_nodeport_repair_reconcile_errors_total
在 nodeport 修复协调循环中发生的协调失败次数。
  • ALPHA
  • 计数器
apiserver_request_aborts_total
apiserver 可能由于超时而中止的请求数,按组、版本、动词、资源、子资源和范围划分。
  • ALPHA
  • 计数器
  • groupresourcescopesubresourceverbversion
apiserver_request_body_size_bytes
Apiserver 请求正文大小(以字节为单位),按资源和动词划分。
  • ALPHA
  • 直方图
  • resourceverb
apiserver_request_filter_duration_seconds
请求筛选器延迟分布(以秒为单位),按每个筛选器类型划分。
  • ALPHA
  • 直方图
  • filter
apiserver_request_post_timeout_total
跟踪 apiserver 超时后请求处理程序的活动。
  • ALPHA
  • 计数器
  • sourcestatus
apiserver_request_sli_duration_seconds
响应延迟分布(不包括 webhook 持续时间和优先级 & 公平队列等待时间),以秒为单位,按每个动词、组、版本、资源、子资源、范围和组件划分。
  • ALPHA
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
apiserver_request_slo_duration_seconds
响应延迟分布(不包括 webhook 持续时间和优先级 & 公平队列等待时间),以秒为单位,按每个动词、组、版本、资源、子资源、范围和组件划分。
  • ALPHA
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
  • 1.27.0
apiserver_request_terminations_total
apiserver 出于自我保护而终止的请求数。
  • ALPHA
  • 计数器
  • codecomponentgroupresourcescopesubresourceverbversion
apiserver_request_timestamp_comparison_time
在 UPDATE 或 PATCH 请求中比较旧对象和新对象所花费的时间。
  • ALPHA
  • 直方图
  • code_path
apiserver_rerouted_request_total
由于本地 apiserver 无法提供服务而代理到对等 kube apiserver 的请求总数。
  • ALPHA
  • 计数器
  • code
apiserver_selfrequest_total
apiserver 自我请求的计数器,按每个动词、API 资源和子资源划分。
  • ALPHA
  • 计数器
  • resourcesubresourceverb
apiserver_storage_data_key_generation_duration_seconds
数据加密密钥(DEK)生成操作的延迟时间(以秒为单位)。
  • ALPHA
  • 直方图
apiserver_storage_data_key_generation_failures_total
失败的数据加密密钥(DEK)生成操作的总数。
  • ALPHA
  • 计数器
apiserver_storage_db_total_size_in_bytes
存储数据库文件在物理上分配的总大小(以字节为单位)。
  • ALPHA
  • 仪表盘
  • endpoint
  • 1.28.0
apiserver_storage_decode_errors_total
按对象类型划分的存储对象解码错误数。
  • ALPHA
  • 计数器
  • 资源
apiserver_storage_envelope_transformation_cache_misses_total
访问密钥解密密钥 (KEK) 时缓存未命中的总数。
  • ALPHA
  • 计数器
apiserver_storage_events_received_total
按类型划分的收到的 etcd 事件数。
  • ALPHA
  • 计数器
  • 资源
apiserver_storage_list_evaluated_objects_total
在为存储 LIST 请求提供服务期间测试的对象数。
  • ALPHA
  • 计数器
  • 资源
apiserver_storage_list_fetched_objects_total
在为存储 LIST 请求提供服务期间从存储中读取的对象数。
  • ALPHA
  • 计数器
  • 资源
apiserver_storage_list_returned_objects_total
从存储返回的 LIST 请求的对象数。
  • ALPHA
  • 计数器
  • 资源
apiserver_storage_list_total
从存储提供的 LIST 请求数。
  • ALPHA
  • 计数器
  • 资源
apiserver_storage_transformation_duration_seconds
值转换操作的延迟时间(以秒为单位)。
  • ALPHA
  • 直方图
  • transformation_typetransformer_prefix
apiserver_storage_transformation_operations_total
转换总数。成功的转换将具有“OK”状态,而转换失败时将具有不同的状态字符串。状态、资源和 transformation_type 字段可用于警报目的。例如,你可以使用 transformation_type(例如,解密的 from_storage 和加密的 to_storage)来监视加密/解密失败。此外,这些字段可用于确保将正确的转换器应用于每个资源。
  • ALPHA
  • 计数器
  • resourcestatustransformation_typetransformer_prefix
apiserver_stream_translator_requests_total
由 StreamTranslatorProxy 处理的请求总数,该代理处理流式 RemoteCommand/V5。
  • ALPHA
  • 计数器
  • code
apiserver_stream_tunnel_requests_total
由 StreamTunnelProxy 处理的请求总数,该代理处理流式 PortForward/V2。
  • ALPHA
  • 计数器
  • code
apiserver_terminated_watchers_total
由于无响应而关闭的观察者的计数器,按资源类型划分。
  • ALPHA
  • 计数器
  • 资源
apiserver_tls_handshake_errors_total
由于“来自 TLS 握手错误”而丢弃的请求数。
  • ALPHA
  • 计数器
apiserver_watch_cache_consistent_read_total
从缓存读取一致数据的计数器。
  • ALPHA
  • 计数器
  • fallbackresourcesuccess
apiserver_watch_cache_events_dispatched_total
按资源类型划分的 watch 缓存中调度的事件的计数器。
  • ALPHA
  • 计数器
  • 资源
apiserver_watch_cache_events_received_total
按资源类型划分的 watch 缓存中收到的事件的计数器。
  • ALPHA
  • 计数器
  • 资源
apiserver_watch_cache_initializations_total
按资源类型划分的 watch 缓存初始化的计数器。
  • ALPHA
  • 计数器
  • 资源
apiserver_watch_cache_read_wait_seconds
等待 watch 缓存变为最新的时间直方图。
  • ALPHA
  • 直方图
  • 资源
apiserver_watch_cache_resource_version
按资源类型划分的 watch 缓存的当前资源版本。
  • ALPHA
  • 仪表盘
  • 资源
apiserver_watch_events_sizes
观察事件大小分布(字节)
  • ALPHA
  • 直方图
  • group(组)kind(类型)version(版本)
apiserver_watch_events_total
在 watch 客户端中发送的事件总数
  • ALPHA
  • 计数器
  • group(组)kind(类型)version(版本)
apiserver_watch_list_duration_seconds
按组、版本、资源和作用域划分的 watch list 请求的响应延迟分布(秒)
  • ALPHA
  • 直方图
  • group(组)resource(资源)scope(作用域)version(版本)
apiserver_webhooks_x509_insecure_sha1_total
计算向其服务证书中具有不安全 SHA1 签名的服务器发出的请求数,或由于不安全的 SHA1 签名导致的连接失败数(根据运行时环境,两者选一)。
  • ALPHA
  • 计数器
apiserver_webhooks_x509_missing_san_total
计算向其服务证书中缺少 SAN 扩展的服务器发出的请求数,或由于缺少 x509 证书 SAN 扩展导致的连接失败数(根据运行时环境,两者选一)。
  • ALPHA
  • 计数器
attach_detach_controller_attachdetach_controller_forced_detaches
A/D 控制器执行强制分离的次数
  • ALPHA
  • 计数器
  • reason
attachdetach_controller_total_volumes
A/D 控制器中的卷数
  • ALPHA
  • 自定义
  • plugin_name(插件名称)state(状态)
authenticated_user_requests
按用户名细分的已认证请求计数器。
  • ALPHA
  • 计数器
  • username(用户名)
authentication_attempts
已认证尝试的计数器。
  • ALPHA
  • 计数器
  • result(结果)
authentication_duration_seconds
按结果细分的身份验证持续时间(秒)。
  • ALPHA
  • 直方图
  • result(结果)
authentication_token_cache_active_fetch_count
  • ALPHA
  • 仪表盘
  • status(状态)
authentication_token_cache_fetch_total
  • ALPHA
  • 计数器
  • status(状态)
authentication_token_cache_request_duration_seconds
  • ALPHA
  • 直方图
  • status(状态)
authentication_token_cache_request_total
  • ALPHA
  • 计数器
  • status(状态)
authorization_attempts_total
按结果细分的授权尝试计数器。结果可以是“allowed”(允许)、“denied”(拒绝)、“no-opinion”(无意见)或“error”(错误)。
  • ALPHA
  • 计数器
  • result(结果)
authorization_duration_seconds
按结果细分的授权持续时间(秒)。
  • ALPHA
  • 直方图
  • result(结果)
cloud_provider_webhook_request_duration_seconds
请求延迟,以秒为单位。按状态代码细分。
  • ALPHA
  • 直方图
  • code(代码)webhook
cloud_provider_webhook_request_total
按状态代码分区的 HTTP 请求数。
  • ALPHA
  • 计数器
  • code(代码)webhook
clustertrustbundle_publisher_sync_duration_seconds
同步集群信任包所花费的时间。
  • ALPHA
  • 直方图
  • code
clustertrustbundle_publisher_sync_total
集群信任包发布者中发生的同步次数。
  • ALPHA
  • 计数器
  • code
container_swap_usage_bytes
容器交换空间当前使用量(字节)。仅在非 Windows 系统上报告
  • ALPHA
  • 自定义
  • containerpodnamespace
csi_operations_seconds
带有 gRPC 错误代码状态的容器存储接口操作持续时间总计
  • ALPHA
  • 直方图
  • driver_name(驱动程序名称)grpc_status_code(grpc 状态代码)method_name(方法名称)migrated(已迁移)
dra_grpc_operations_duration_seconds
DRA gRPC 操作的持续时间(秒)
  • ALPHA
  • 直方图
  • driver_name(驱动程序名称)grpc_status_code(grpc 状态代码)method_name(方法名称)
dra_operations_duration_seconds
当 Pod 启动或停止时,处理 Pod 引用的所有 ResourceClaims 的持续时间的延迟直方图(秒)。通过操作名称(PrepareResources 或 UnprepareResources)标识,并按操作的成功与否进行分隔。失败的操作次数通过直方图的总计数提供。
  • ALPHA
  • 直方图
  • is_error(是否错误)operation_name(操作名称)
endpoint_slice_controller_changes
EndpointSlice 更改的数量
  • ALPHA
  • 计数器
  • operation(操作)
endpoint_slice_controller_desired_endpoint_slices
在完美的端点分配情况下将存在的 EndpointSlice 的数量
  • ALPHA
  • 仪表盘
endpoint_slice_controller_endpoints_added_per_sync
每次 Service 同步时添加的端点数
  • ALPHA
  • 直方图
endpoint_slice_controller_endpoints_desired
期望的端点数
  • ALPHA
  • 仪表盘
endpoint_slice_controller_endpoints_removed_per_sync
每次 Service 同步时删除的端点数
  • ALPHA
  • 直方图
endpoint_slice_controller_endpointslices_changed_per_sync
每次 Service 同步时更改的 EndpointSlice 的数量
  • ALPHA
  • 直方图
  • topology(拓扑)traffic_distribution(流量分布)
endpoint_slice_controller_num_endpoint_slices
EndpointSlice 的数量
  • ALPHA
  • 仪表盘
endpoint_slice_controller_services_count_by_traffic_distribution
使用某些特定 trafficDistribution 的服务数量
  • ALPHA
  • 仪表盘
  • traffic_distribution(流量分布)
endpoint_slice_controller_syncs
EndpointSlice 同步次数
  • ALPHA
  • 计数器
  • result(结果)
endpoint_slice_mirroring_controller_addresses_skipped_per_sync
每次端点同步时,由于无效或超出 MaxEndpointsPerSubset 而跳过的地址数
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_changes
EndpointSlice 更改的数量
  • ALPHA
  • 计数器
  • operation(操作)
endpoint_slice_mirroring_controller_desired_endpoint_slices
在完美的端点分配情况下将存在的 EndpointSlice 的数量
  • ALPHA
  • 仪表盘
endpoint_slice_mirroring_controller_endpoints_added_per_sync
每次端点同步时添加的端点数
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_desired
期望的端点数
  • ALPHA
  • 仪表盘
endpoint_slice_mirroring_controller_endpoints_removed_per_sync
每次端点同步时删除的端点数
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_sync_duration
syncEndpoints() 的持续时间(秒)
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_updated_per_sync
每次端点同步时更新的端点数
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_num_endpoint_slices
EndpointSlice 的数量
  • ALPHA
  • 仪表盘
ephemeral_volume_controller_create_failures_total
PersistentVolumeClaim 创建请求的数量
  • ALPHA
  • 计数器
ephemeral_volume_controller_create_total
PersistentVolumeClaim 创建请求的数量
  • ALPHA
  • 计数器
etcd_bookmark_counts
按类型拆分的 etcd 书签(进度通知事件)的数量。
  • ALPHA
  • 仪表盘
  • 资源
etcd_lease_object_counts
附加到单个 etcd 租约的对象数量。
  • ALPHA
  • 直方图
etcd_request_duration_seconds
每个操作和对象类型的 Etcd 请求延迟(秒)。
  • ALPHA
  • 直方图
  • operation(操作)type(类型)
etcd_request_errors_total
每个操作和对象类型的 Etcd 失败请求计数。
  • ALPHA
  • 计数器
  • operation(操作)type(类型)
etcd_requests_total
每个操作和对象类型的 Etcd 请求计数。
  • ALPHA
  • 计数器
  • operation(操作)type(类型)
etcd_version_info
Etcd 服务器的二进制版本
  • ALPHA
  • 仪表盘
  • binary_version(二进制版本)
field_validation_request_duration_seconds
每个字段验证值的响应延迟分布(秒)
  • ALPHA
  • 直方图
  • field_validation(字段验证)
force_cleaned_failed_volume_operation_errors_total
在 kubelet 启动期间重建失败后,强制清理失败的卷的数量。
  • ALPHA
  • 计数器
force_cleaned_failed_volume_operations_total
在 kubelet 启动期间重建失败后,强制清理的卷的数量。这包括成功和失败的清理。
  • ALPHA
  • 计数器
garbagecollector_controller_resources_sync_error_total
垃圾收集器资源同步错误的数量
  • ALPHA
  • 计数器
horizontal_pod_autoscaler_controller_metric_computation_duration_seconds
HPA 控制器计算一个指标所花费的时间(秒)。标签“action”应该是“scale_down”、“scale_up”或“none”。标签“error”应该是“spec”、“internal”或“none”。标签“metric_type”对应于 HPA.spec.metrics[*].type
  • ALPHA
  • 直方图
  • action(操作)error(错误)metric_type(指标类型)
horizontal_pod_autoscaler_controller_metric_computation_total
指标计算的数量。标签“action”应该是“scale_down”、“scale_up”或“none”。此外,标签“error”应该是“spec”、“internal”或“none”。标签“metric_type”对应于 HPA.spec.metrics[*].type
  • ALPHA
  • 计数器
  • action(操作)error(错误)metric_type(指标类型)
horizontal_pod_autoscaler_controller_reconciliation_duration_seconds
HPA 控制器一次协调所花费的时间(秒)。标签“action”应该是“scale_down”、“scale_up”或“none”。此外,标签“error”应该是“spec”、“internal”或“none”。请注意,如果在协调期间发生规范错误和内部错误,则在“error”标签中报告发生的第一个错误。
  • ALPHA
  • 直方图
  • action(操作)error(错误)
horizontal_pod_autoscaler_controller_reconciliations_total
HPA 控制器的协调次数。标签“action”应该是“scale_down”、“scale_up”或“none”。此外,标签“error”应该是“spec”、“internal”或“none”。请注意,如果在协调期间发生规范错误和内部错误,则在“error”标签中报告发生的第一个错误。
  • ALPHA
  • 计数器
  • action(操作)error(错误)
job_controller_job_finished_indexes_total
`已完成的索引数。 status 标签的可能值为:“succeeded”(成功)、“failed”(失败)。 backoffLimit 标签的可能值为:“perIndex”和“global”`
  • ALPHA
  • 计数器
  • backoffLimit(退避限制)status(状态)
job_controller_job_pods_creation_total
`作业控制器创建的 Pod 的数量,并标有 Pod 创建的原因。此指标还区分了使用不同 PodReplacementPolicy 设置创建的 Pod。 “reason”标签的可能值为:“new”、“recreate_terminating_or_failed”、“recreate_failed”。“status”标签的可能值为:“succeeded”、“failed”。`
  • ALPHA
  • 计数器
  • reason(原因)status(状态)
job_controller_jobs_by_external_controller_total
由外部控制器管理的作业数量
  • ALPHA
  • 计数器
  • controller_name(控制器名称)
job_controller_pod_failures_handled_by_failure_policy_total
`根据匹配的规则,由失败策略处理的失败 Pod 的数量,以及所应用的失败策略操作。 action 标签的可能值对应于失败策略规则操作的可能值,它们是:“FailJob”、“Ignore”和“Count”。`
  • ALPHA
  • 计数器
  • action(操作)
job_controller_terminated_pods_tracking_finalizer_total
`具有 finalizer batch.kubernetes.io/job-tracking 的已终止 Pod 的数量(phase=Failed|Succeeded)。 event 标签可以是“add”或“delete”。`
  • ALPHA
  • 计数器
  • event(事件)
kube_apiserver_clusterip_allocator_allocated_ips
衡量服务分配的 IP 数量的指标
  • ALPHA
  • 仪表盘
  • cidr
kube_apiserver_clusterip_allocator_allocation_duration_seconds
按 ServiceCIDR 分配集群 IP 的持续时间(秒)
  • ALPHA
  • 直方图
  • cidr
kube_apiserver_clusterip_allocator_allocation_errors_total
尝试分配集群 IP 时发生的错误数
  • ALPHA
  • 计数器
  • cidrscope(作用域)
kube_apiserver_clusterip_allocator_allocation_total
集群 IP 分配的数量
  • ALPHA
  • 计数器
  • cidrscope(作用域)
kube_apiserver_clusterip_allocator_available_ips
衡量服务可用 IP 数量的指标
  • ALPHA
  • 仪表盘
  • cidr
kube_apiserver_nodeport_allocator_allocated_ports
衡量服务分配的 NodePort 数量的指标
  • ALPHA
  • 仪表盘
kube_apiserver_nodeport_allocator_allocation_errors_total
尝试分配 NodePort 时发生的错误数
  • ALPHA
  • 计数器
  • scope(作用域)
kube_apiserver_nodeport_allocator_allocation_total
NodePort 分配的数量
  • ALPHA
  • 计数器
  • scope(作用域)
kube_apiserver_nodeport_allocator_available_ports
衡量服务可用 NodePort 数量的指标
  • ALPHA
  • 仪表盘
kube_apiserver_pod_logs_backend_tls_failure_total
由于 kubelet 服务器 TLS 验证失败而导致的 pods/logs 请求的总数
  • ALPHA
  • 计数器
kube_apiserver_pod_logs_insecure_backend_total
按使用类型切分的 pods/logs 请求总数:enforce_tls、skip_tls_allowed、skip_tls_denied
  • ALPHA
  • 计数器
  • usage(使用)
kube_apiserver_pod_logs_pods_logs_backend_tls_failure_total
由于 kubelet 服务器 TLS 验证失败而导致的 pods/logs 请求的总数
  • ALPHA
  • 计数器
  • 1.27.0
kube_apiserver_pod_logs_pods_logs_insecure_backend_total
按使用类型切分的 pods/logs 请求总数:enforce_tls、skip_tls_allowed、skip_tls_denied
  • ALPHA
  • 计数器
  • usage(使用)
  • 1.27.0
kubelet_active_pods
kubelet 认为处于活动状态并在准入新 Pod 时考虑的 Pod 数量。如果 Pod 不是来自 apiserver,则 static 为 true。
  • ALPHA
  • 仪表盘
  • static(静态)
kubelet_admission_rejections_total
Kubelet 拒绝的 Pod 准入的累计数量。
  • ALPHA
  • 计数器
  • reason
kubelet_certificate_manager_client_expiration_renew_errors
证书续订错误的计数器。
  • ALPHA
  • 计数器
kubelet_certificate_manager_client_ttl_seconds
Kubelet 客户端证书的 TTL(生存时间)的指标。该值以秒为单位,直到证书过期(如果已过期则为负值)。如果客户端证书无效或未使用,则该值为 +INF。
  • ALPHA
  • 仪表盘
kubelet_certificate_manager_server_rotation_seconds
上一个证书在轮换之前存在的秒数的直方图。
  • ALPHA
  • 直方图
kubelet_certificate_manager_server_ttl_seconds
Kubelet 服务证书的最短 TTL(生存时间)的指标。该值以秒为单位,直到证书过期(如果已过期则为负值)。如果服务证书无效或未使用,则该值为 +INF。
  • ALPHA
  • 仪表盘
kubelet_cgroup_manager_duration_seconds
cgroup 管理器操作的持续时间(秒)。按方法细分。
  • ALPHA
  • 直方图
  • operation_type(操作类型)
kubelet_cgroup_version
主机上的 cgroup 版本。
  • ALPHA
  • 仪表盘
kubelet_container_aligned_compute_resources_count
按对齐类型分配给容器的对齐计算资源的累积数量。
  • ALPHA
  • 计数器
  • boundary(边界)scope(作用域)
kubelet_container_log_filesystem_used_bytes
容器日志在文件系统上使用的字节数。
  • ALPHA
  • 自定义
  • uidnamespace(命名空间)podcontainer(容器)
kubelet_containers_per_pod_count
每个 Pod 的容器数。
  • ALPHA
  • 直方图
kubelet_cpu_manager_exclusive_cpu_allocation_count
独占分配给在此节点上运行的容器的 CPU 总数
  • ALPHA
  • 仪表盘
kubelet_cpu_manager_pinning_errors_total
需要绑定 CPU 核心但失败的分配次数。
  • ALPHA
  • 计数器
kubelet_cpu_manager_pinning_requests_total
需要绑定 CPU 核心的分配次数。
  • ALPHA
  • 计数器
kubelet_cpu_manager_shared_pool_size_millicores
非 Guaranteed QoS Pod 的共享 CPU 池大小,以毫核为单位。
  • ALPHA
  • 仪表盘
kubelet_credential_provider_plugin_duration
凭证提供程序插件的执行时长,以秒为单位
  • ALPHA
  • 直方图
  • plugin_name
kubelet_credential_provider_plugin_errors
凭证提供程序插件的错误数
  • ALPHA
  • 计数器
  • plugin_name
kubelet_desired_pods
kubelet 被指示运行的 Pod 数量。如果 Pod 不是来自 apiserver,则 static 为 true。
  • ALPHA
  • 仪表盘
  • static(静态)
kubelet_device_plugin_alloc_duration_seconds
服务设备插件 Allocation 请求的持续时间,以秒为单位。按资源名称细分。
  • ALPHA
  • 直方图
  • resource_name
kubelet_device_plugin_registration_total
设备插件注册的累积数量。按资源名称细分。
  • ALPHA
  • 计数器
  • resource_name
kubelet_evented_pleg_connection_error_count
与 CRI 运行时建立流式连接期间遇到的错误数。
  • ALPHA
  • 计数器
kubelet_evented_pleg_connection_latency_seconds
与 CRI 运行时的流式连接的延迟,以秒为单位。
  • ALPHA
  • 直方图
kubelet_evented_pleg_connection_success_count
获取流式客户端以接收 CRI 事件的次数。
  • ALPHA
  • 计数器
kubelet_eviction_stats_age_seconds
从收集统计信息到根据驱逐信号驱逐 Pod 之间的时间
  • ALPHA
  • 直方图
  • eviction_signal
kubelet_evictions
按驱逐信号划分的 Pod 驱逐的累积数量
  • ALPHA
  • 计数器
  • eviction_signal
kubelet_graceful_shutdown_end_time_seconds
自 Unix 纪元以来的上次优雅关机结束时间,以秒为单位
  • ALPHA
  • 仪表盘
kubelet_graceful_shutdown_start_time_seconds
自 Unix 纪元以来的上次优雅关机开始时间,以秒为单位
  • ALPHA
  • 仪表盘
kubelet_http_inflight_requests
正在处理的 HTTP 请求的数量
  • ALPHA
  • 仪表盘
  • long_runningmethodpathserver_type
kubelet_http_requests_duration_seconds
服务 HTTP 请求的持续时间,以秒为单位
  • ALPHA
  • 直方图
  • long_runningmethodpathserver_type
kubelet_http_requests_total
自服务器启动以来收到的 HTTP 请求数
  • ALPHA
  • 计数器
  • long_runningmethodpathserver_type
kubelet_image_garbage_collected_total
kubelet 回收的镜像总数,无论是通过磁盘使用情况还是镜像存在时间。
  • ALPHA
  • 计数器
  • reason
kubelet_image_pull_duration_seconds
拉取镜像的持续时间,以秒为单位。
  • ALPHA
  • 直方图
  • image_size_in_bytes
kubelet_lifecycle_handler_http_fallbacks_total
生命周期处理程序从 HTTPS 成功回退到 HTTP 的次数。
  • ALPHA
  • 计数器
kubelet_managed_ephemeral_containers
此 kubelet 管理的 Pod 中当前临时容器的数量。
  • ALPHA
  • 仪表盘
kubelet_memory_manager_pinning_errors_total
需要绑定但失败的内存页分配次数。
  • ALPHA
  • 计数器
kubelet_memory_manager_pinning_requests_total
需要绑定的内存页分配次数。
  • ALPHA
  • 计数器
kubelet_mirror_pods
kubelet 将尝试创建的镜像 Pod 数量(每个允许的静态 Pod 一个)
  • ALPHA
  • 仪表盘
kubelet_node_name
节点的名称。计数始终为 1。
  • ALPHA
  • 仪表盘
  • node
kubelet_node_startup_duration_seconds
节点启动的总持续时间,以秒为单位。
  • ALPHA
  • 仪表盘
kubelet_node_startup_post_registration_duration_seconds
注册后节点启动的持续时间,以秒为单位。
  • ALPHA
  • 仪表盘
kubelet_node_startup_pre_kubelet_duration_seconds
kubelet 启动前节点启动的持续时间,以秒为单位。
  • ALPHA
  • 仪表盘
kubelet_node_startup_pre_registration_duration_seconds
注册前节点启动的持续时间,以秒为单位。
  • ALPHA
  • 仪表盘
kubelet_node_startup_registration_duration_seconds
注册期间节点启动的持续时间,以秒为单位。
  • ALPHA
  • 仪表盘
kubelet_orphan_pod_cleaned_volumes
上次定期扫描中清理其卷的孤立 Pod 的总数。
  • ALPHA
  • 仪表盘
kubelet_orphan_pod_cleaned_volumes_errors
上次定期扫描中清理卷失败的孤立 Pod 的数量。
  • ALPHA
  • 仪表盘
kubelet_orphaned_runtime_pods_total
在容器运行时中检测到但 Pod 工作程序尚未知的 Pod 的数量。这通常表示 kubelet 在 API 中或在本地配置中强制删除 Pod 时重新启动,这很不寻常。
  • ALPHA
  • 计数器
kubelet_pleg_discard_events
PLEG 中丢弃的事件数。
  • ALPHA
  • 计数器
kubelet_pleg_last_seen_seconds
上次看到 PLEG 处于活动状态的时间戳,以秒为单位。
  • ALPHA
  • 仪表盘
kubelet_pleg_relist_duration_seconds
PLEG 中重新列出 Pod 的持续时间,以秒为单位。
  • ALPHA
  • 直方图
kubelet_pleg_relist_interval_seconds
PLEG 中重新列出的间隔时间,以秒为单位。
  • ALPHA
  • 直方图
kubelet_pod_resources_endpoint_errors_get
对 PodResource Get 端点的请求返回错误的次数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_errors_get_allocatable
对 PodResource GetAllocatableResources 端点的请求返回错误的次数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_errors_list
对 PodResource List 端点的请求返回错误的次数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_requests_get
对 PodResource Get 端点的请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_requests_get_allocatable
对 PodResource GetAllocatableResources 端点的请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_requests_list
对 PodResource List 端点的请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_requests_total
对 PodResource 端点的请求的累积数量。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_start_duration_seconds
从 kubelet 首次看到 Pod 到 Pod 开始运行的持续时间,以秒为单位
  • ALPHA
  • 直方图
kubelet_pod_start_sli_duration_seconds
启动 Pod 的持续时间,以秒为单位,不包括拉取镜像和运行初始化容器的时间,从 Pod 创建时间戳到所有容器报告为已启动并通过监视观察到时开始计算
  • ALPHA
  • 直方图
kubelet_pod_start_total_duration_seconds
自创建以来启动 Pod 的持续时间,以秒为单位,包括拉取镜像和运行初始化容器的时间,从 Pod 创建时间戳到所有容器报告为已启动并通过监视观察到时开始计算
  • ALPHA
  • 直方图
kubelet_pod_status_sync_duration_seconds
同步 Pod 状态更新的持续时间,以秒为单位。衡量从检测到 Pod 状态变化到成功更新该 Pod 的 API 的时间,即使 Pod 状态发生多次中间变化。
  • ALPHA
  • 直方图
kubelet_pod_worker_duration_seconds
同步单个 Pod 的持续时间,以秒为单位。按操作类型细分:创建、更新或同步
  • ALPHA
  • 直方图
  • operation_type(操作类型)
kubelet_pod_worker_start_duration_seconds
从 kubelet 看到 Pod 到启动工作程序的持续时间,以秒为单位。
  • ALPHA
  • 直方图
kubelet_preemptions
按抢占资源划分的 Pod 抢占的累积数量
  • ALPHA
  • 计数器
  • preemption_signal
kubelet_restarted_pods_total
由于在 kubelet 正在监视它们时被删除并使用相同的 UID 重新创建而重新启动的 Pod 的数量(静态 Pod 常见,API Pod 非常罕见)
  • ALPHA
  • 计数器
  • static(静态)
kubelet_run_podsandbox_duration_seconds
run_podsandbox 操作的持续时间,以秒为单位。按 RuntimeClass.Handler 细分。
  • ALPHA
  • 直方图
  • runtime_handler
kubelet_run_podsandbox_errors_total
按 RuntimeClass.Handler 划分的 run_podsandbox 操作错误的累积数量。
  • ALPHA
  • 计数器
  • runtime_handler
kubelet_running_containers
当前正在运行的容器数量
  • ALPHA
  • 仪表盘
  • container_state
kubelet_running_pods
具有正在运行的 Pod 沙箱的 Pod 数量
  • ALPHA
  • 仪表盘
kubelet_runtime_operations_duration_seconds
运行时操作的持续时间,以秒为单位。按操作类型细分。
  • ALPHA
  • 直方图
  • operation_type(操作类型)
kubelet_runtime_operations_errors_total
按操作类型划分的运行时操作错误的累积数量。
  • ALPHA
  • 计数器
  • operation_type(操作类型)
kubelet_runtime_operations_total
按操作类型划分的运行时操作的累积数量。
  • ALPHA
  • 计数器
  • operation_type(操作类型)
kubelet_server_expiration_renew_errors
证书续订错误的计数器。
  • ALPHA
  • 计数器
kubelet_sleep_action_terminated_early_total
生命周期休眠处理程序在完成之前被终止的次数
  • ALPHA
  • 计数器
kubelet_started_containers_errors_total
启动容器时发生的错误累积数量
  • ALPHA
  • 计数器
  • codecontainer_type
kubelet_started_containers_total
启动的容器的累积数量
  • ALPHA
  • 计数器
  • container_type
kubelet_started_host_process_containers_errors_total
启动 hostprocess 容器时发生的错误累积数量。此指标仅在 Windows 上收集。
  • ALPHA
  • 计数器
  • codecontainer_type
kubelet_started_host_process_containers_total
启动的 hostprocess 容器的累积数量。此指标仅在 Windows 上收集。
  • ALPHA
  • 计数器
  • container_type
kubelet_started_pods_errors_total
启动 Pod 时发生的错误累积数量
  • ALPHA
  • 计数器
kubelet_started_pods_total
启动的 Pod 的累积数量
  • ALPHA
  • 计数器
kubelet_topology_manager_admission_duration_ms
服务 Pod 准入请求的持续时间,以毫秒为单位。
  • ALPHA
  • 直方图
kubelet_topology_manager_admission_errors_total
无法对齐资源时的准入请求失败次数。
  • ALPHA
  • 计数器
kubelet_topology_manager_admission_requests_total
必须对齐资源的准入请求数量。
  • ALPHA
  • 计数器
kubelet_volume_metric_collection_duration_seconds
计算卷统计信息的持续时间,以秒为单位
  • ALPHA
  • 直方图
  • metric_source
kubelet_volume_stats_available_bytes
卷中可用字节数
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_capacity_bytes
卷的容量,以字节为单位
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_health_status_abnormal
异常卷健康状态。计数为 1 或 0。1 表示卷不健康,0 表示卷健康
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes
卷中的最大 inode 数
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes_free
卷中可用 inode 数
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes_used
卷中已使用的 inode 数
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_used_bytes
卷中已使用的字节数
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_working_pods
kubelet 实际运行的 Pod 数量,按生命周期阶段、Pod 是否为所需 Pod、孤立 Pod 或仅运行时 Pod(也是孤立 Pod)以及 Pod 是否为静态 Pod 进行细分。孤立 Pod 已从本地配置中删除或在 API 中强制删除,并消耗了其他不可见的资源。
  • ALPHA
  • 仪表盘
  • configlifecyclestatic
kubeproxy_iptables_ct_state_invalid_dropped_packets_total
iptables 为解决 conntrack 问题而丢弃的数据包
  • ALPHA
  • 自定义
kubeproxy_iptables_localhost_nodeports_accepted_packets_total
在环回接口的节点端口上接受的数据包数
  • ALPHA
  • 自定义
kubeproxy_network_programming_duration_seconds
集群内网络编程延迟,以秒为单位
  • ALPHA
  • 直方图
kubeproxy_proxy_healthz_total
累积代理 healthz HTTP 状态
  • ALPHA
  • 计数器
  • code
kubeproxy_proxy_livez_total
累积代理 livez HTTP 状态
  • ALPHA
  • 计数器
  • code
kubeproxy_sync_full_proxy_rules_duration_seconds
完整重新同步的 SyncProxyRules 延迟,以秒为单位
  • ALPHA
  • 直方图
kubeproxy_sync_partial_proxy_rules_duration_seconds
部分重新同步的 SyncProxyRules 延迟,以秒为单位
  • ALPHA
  • 直方图
kubeproxy_sync_proxy_rules_duration_seconds
SyncProxyRules 延迟,以秒为单位
  • ALPHA
  • 直方图
kubeproxy_sync_proxy_rules_endpoint_changes_pending
待处理的代理规则端点更改
  • ALPHA
  • 仪表盘
kubeproxy_sync_proxy_rules_endpoint_changes_total
累积的代理规则端点更改
  • ALPHA
  • 计数器
kubeproxy_sync_proxy_rules_iptables_last
kube-proxy 在上次同步中写入的 iptables 规则数
  • ALPHA
  • 仪表盘
  • table
kubeproxy_sync_proxy_rules_iptables_partial_restore_failures_total
累计代理 iptables 部分恢复失败次数
  • ALPHA
  • 计数器
kubeproxy_sync_proxy_rules_iptables_restore_failures_total
累计代理 iptables 恢复失败次数
  • ALPHA
  • 计数器
kubeproxy_sync_proxy_rules_iptables_total
kube-proxy 拥有的 iptables 规则总数
  • ALPHA
  • 仪表盘
  • table
kubeproxy_sync_proxy_rules_last_queued_timestamp_seconds
上次代理规则同步入队的时间
  • ALPHA
  • 仪表盘
kubeproxy_sync_proxy_rules_last_timestamp_seconds
上次成功同步代理规则的时间
  • ALPHA
  • 仪表盘
kubeproxy_sync_proxy_rules_nftables_cleanup_failures_total
累计代理 nftables 清理失败次数
  • ALPHA
  • 计数器
kubeproxy_sync_proxy_rules_nftables_sync_failures_total
累计代理 nftables 同步失败次数
  • ALPHA
  • 计数器
kubeproxy_sync_proxy_rules_no_local_endpoints_total
具有 Local 流量策略且没有端点的服务数量
  • ALPHA
  • 仪表盘
  • traffic_policy
kubeproxy_sync_proxy_rules_service_changes_pending
待处理的代理规则服务更改
  • ALPHA
  • 仪表盘
kubeproxy_sync_proxy_rules_service_changes_total
累计代理规则服务更改次数
  • ALPHA
  • 计数器
kubernetes_build_info
一个常量值为“1”的指标,带有 Kubernetes 构建时的 major、minor、git 版本、git commit、git 树状态、构建日期、Go 版本和编译器,以及它运行的平台标签。
  • ALPHA
  • 仪表盘
  • build_datecompilergit_commitgit_tree_stategit_versiongo_versionmajorminorplatform
leader_election_master_status
报告系统是否是相关租约的 Master 的指标,0 表示备份,1 表示 Master。“name”是用于标识租约的字符串。请确保按名称分组。
  • ALPHA
  • 仪表盘
  • name
leader_election_slowpath_total
续订领导租约时执行的慢路径总数。“name”是用于标识租约的字符串。请确保按名称分组。
  • ALPHA
  • 计数器
  • name
node_authorizer_graph_actions_duration_seconds
节点授权器中图操作持续时间的直方图。
  • ALPHA
  • 直方图
  • operation(操作)
node_collector_unhealthy_nodes_in_zone
衡量每个区域中未就绪节点的数量的指标。
  • ALPHA
  • 仪表盘
  • 区域
node_collector_update_all_nodes_health_duration_seconds
NodeController 更新所有节点健康状况的持续时间(秒)。
  • ALPHA
  • 直方图
node_collector_update_node_health_duration_seconds
NodeController 更新单个节点健康状况的持续时间(秒)。
  • ALPHA
  • 直方图
node_collector_zone_health
衡量每个区域健康节点百分比的指标。
  • ALPHA
  • 仪表盘
  • 区域
node_collector_zone_size
衡量每个区域中已注册节点数量的指标。
  • ALPHA
  • 仪表盘
  • 区域
node_controller_cloud_provider_taint_removal_delay_seconds
NodeController 删除单个节点的云提供商污点后,节点创建后的秒数。
  • ALPHA
  • 直方图
node_controller_initial_node_sync_delay_seconds
NodeController 完成单个节点的初始同步后,节点创建后的秒数。
  • ALPHA
  • 直方图
node_ipam_controller_cidrset_allocation_tries_per_request
每次 Service 同步时添加的端点数
  • ALPHA
  • 直方图
  • clusterCIDR
node_ipam_controller_cidrset_cidrs_allocations_total
衡量 CIDR 分配总数的计数器。
  • ALPHA
  • 计数器
  • clusterCIDR
node_ipam_controller_cidrset_cidrs_releases_total
衡量 CIDR 释放总数的计数器。
  • ALPHA
  • 计数器
  • clusterCIDR
node_ipam_controller_cidrset_usage_cidrs
衡量已分配 CIDR 百分比的指标。
  • ALPHA
  • 仪表盘
  • clusterCIDR
node_ipam_controller_cirdset_max_cidrs
可以分配的最大 CIDR 数量。
  • ALPHA
  • 仪表盘
  • clusterCIDR
node_swap_usage_bytes
节点当前使用的交换空间大小(字节)。仅在非 Windows 系统上报告
  • ALPHA
  • 自定义
plugin_manager_total_plugins
插件管理器中的插件数量
  • ALPHA
  • 自定义
  • socket_pathstate
pod_gc_collector_force_delete_pod_errors_total
自 Pod GC 控制器启动以来,强制删除 Pod 时遇到的错误数量。
  • ALPHA
  • 计数器
  • namespacereason
pod_gc_collector_force_delete_pods_total
自 Pod GC 控制器启动以来,正在强制删除的 Pod 数量。
  • ALPHA
  • 计数器
  • namespacereason
pod_security_errors_total
阻止正常评估的错误数量。非致命错误可能会导致使用最新的受限配置文件进行评估。
  • ALPHA
  • 计数器
  • fatalrequest_operationresourcesubresource
pod_security_evaluations_total
发生的策略评估次数,不包括忽略或豁免的请求。
  • ALPHA
  • 计数器
  • decisionmodepolicy_levelpolicy_versionrequest_operationresourcesubresource
pod_security_exemptions_total
豁免的请求数量,不包括忽略或超出范围的请求。
  • ALPHA
  • 计数器
  • request_operationresourcesubresource
pod_swap_usage_bytes
Pod 当前使用的交换空间大小(字节)。仅在非 Windows 系统上报告
  • ALPHA
  • 自定义
  • podnamespace
prober_probe_duration_seconds
探测响应的持续时间(秒)。
  • ALPHA
  • 直方图
  • containernamespacepodprobe_type
prober_probe_total
按结果划分的容器的存活、就绪或启动探测的累计数量。
  • ALPHA
  • 计数器
  • containernamespacepodpod_uidprobe_typeresult
pv_collector_bound_pv_count
衡量当前绑定的持久卷数量的指标
  • ALPHA
  • 自定义
  • storage_class
pv_collector_bound_pvc_count
衡量当前绑定的持久卷声明数量的指标
  • ALPHA
  • 自定义
  • namespacestorage_classvolume_attributes_class
pv_collector_total_pv_count
衡量持久卷总数的指标
  • ALPHA
  • 自定义
  • plugin_namevolume_mode
pv_collector_unbound_pv_count
衡量当前未绑定的持久卷数量的指标
  • ALPHA
  • 自定义
  • storage_class
pv_collector_unbound_pvc_count
衡量当前未绑定的持久卷声明数量的指标
  • ALPHA
  • 自定义
  • namespacestorage_classvolume_attributes_class
reconstruct_volume_operations_errors_total
在 kubelet 启动期间,从操作系统重建失败的卷的数量。
  • ALPHA
  • 计数器
reconstruct_volume_operations_total
在 kubelet 启动期间,尝试从操作系统重建的卷的数量。这包括成功和失败的重建。
  • ALPHA
  • 计数器
replicaset_controller_sorting_deletion_age_ratio
选定的已删除 Pod 的年龄与当前最年轻 Pod 的年龄(当时)之比。应小于 2。此指标的目的是衡量 LogarithmicScaleDown 功能门对缩减副本集时 Pod 排序(和删除)效果的大致程度。这仅在计算和报告时考虑就绪 Pod。
  • ALPHA
  • 直方图
resourceclaim_controller_allocated_resource_claims
已分配的 ResourceClaims 数量
  • ALPHA
  • 仪表盘
resourceclaim_controller_create_attempts_total
ResourceClaims 创建请求的数量
  • ALPHA
  • 计数器
resourceclaim_controller_create_failures_total
ResourceClaims 创建请求失败的数量
  • ALPHA
  • 计数器
resourceclaim_controller_resource_claims
ResourceClaims 的数量
  • ALPHA
  • 仪表盘
rest_client_dns_resolution_duration_seconds
DNS 解析器延迟(秒)。按主机细分。
  • ALPHA
  • 直方图
  • host
rest_client_exec_plugin_call_total
对 exec 插件的调用次数,按遇到的事件类型(no_error、plugin_execution_error、plugin_not_found_error、client_internal_error)和可选的退出代码进行分区。当且仅当插件调用成功时,退出代码将设置为 0。
  • ALPHA
  • 计数器
  • call_statuscode
rest_client_exec_plugin_certificate_rotation_age
上次授权执行插件客户端证书在轮换之前的生存秒数的直方图。如果未使用的授权执行插件客户端证书,则直方图将不包含数据。
  • ALPHA
  • 直方图
rest_client_exec_plugin_ttl_seconds
由授权执行插件管理的客户端证书的最短 TTL(生存时间)的指标。该值是证书到期前的秒数(如果已过期,则为负数)。如果未使用授权执行插件或未管理 TLS 证书,则该值将为 +INF。
  • ALPHA
  • 仪表盘
rest_client_rate_limiter_duration_seconds
客户端速率限制器延迟(秒)。按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_request_duration_seconds
请求延迟(秒)。按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_request_retries_total
请求重试次数,按状态代码、动词和主机分区。
  • ALPHA
  • 计数器
  • codehostverb
rest_client_request_size_bytes
请求大小(字节)。按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_requests_total
HTTP 请求数量,按状态代码、方法和主机分区。
  • ALPHA
  • 计数器
  • codehostmethod
rest_client_response_size_bytes
响应大小(字节)。按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_transport_cache_entries
内部缓存中的传输条目数。
  • ALPHA
  • 仪表盘
rest_client_transport_create_calls_total
获取新传输的调用次数,按操作结果分区:命中:从缓存获取,未命中:创建并添加到缓存,不可缓存:创建且未缓存
  • ALPHA
  • 计数器
  • result(结果)
retroactive_storageclass_errors_total
对持久卷声明的追溯 StorageClass 分配失败的总次数
  • ALPHA
  • 计数器
retroactive_storageclass_total
对持久卷声明的追溯 StorageClass 分配的总次数
  • ALPHA
  • 计数器
root_ca_cert_publisher_sync_duration_seconds
根 CA 证书发布者中发生的命名空间同步次数。
  • ALPHA
  • 直方图
  • code
root_ca_cert_publisher_sync_total
根 CA 证书发布者中发生的命名空间同步次数。
  • ALPHA
  • 计数器
  • code
running_managed_controllers
指示控制器实例当前在何处运行
  • ALPHA
  • 仪表盘
  • managername
scheduler_event_handling_duration_seconds
事件处理延迟(秒)。
  • ALPHA
  • 直方图
  • event(事件)
scheduler_goroutines
按其执行的工作(例如绑定)拆分的正在运行的 goroutine 数。
  • ALPHA
  • 仪表盘
  • operation(操作)
scheduler_inflight_events
调度队列中当前跟踪的事件数。
  • ALPHA
  • 仪表盘
  • event(事件)
scheduler_permit_wait_duration_seconds
等待许可的持续时间。
  • ALPHA
  • 直方图
  • result(结果)
scheduler_plugin_evaluation_total
每个插件和扩展点尝试调度 Pod 的次数(仅在 PreFilter、Filter、PreScore 和 Score 中可用)。
  • ALPHA
  • 计数器
  • extension_pointpluginprofile
scheduler_plugin_execution_duration_seconds
在特定扩展点运行插件的持续时间。
  • ALPHA
  • 直方图
  • extension_pointpluginstatus
scheduler_preemption_goroutines_duration_seconds
运行抢占 goroutine 的持续时间(秒)。
  • ALPHA
  • 直方图
  • result(结果)
scheduler_preemption_goroutines_execution_total
执行的抢占 goroutine 的数量。
  • ALPHA
  • 计数器
  • result(结果)
scheduler_queueing_hint_execution_duration_seconds
运行插件的排队提示功能的持续时间。
  • ALPHA
  • 直方图
  • eventhintplugin
scheduler_scheduler_cache_size
调度器缓存中节点、Pod和假定(已绑定)Pod的数量。
  • ALPHA
  • 仪表盘
  • type
scheduler_scheduling_algorithm_duration_seconds
调度算法的延迟,以秒为单位
  • ALPHA
  • 直方图
scheduler_unschedulable_pods
按插件名称细分的不可调度 Pod 的数量。一个 Pod 会增加导致其无法调度的所有插件的指标,因此只有按插件细分时,此指标才有意义。
  • ALPHA
  • 仪表盘
  • pluginprofile
scheduler_volume_binder_cache_requests_total
请求卷绑定的缓存总数
  • ALPHA
  • 计数器
  • operation(操作)
scheduler_volume_scheduling_stage_error_total
卷调度阶段的错误计数
  • ALPHA
  • 计数器
  • operation(操作)
scrape_error
如果在获取容器指标时出现错误,则为 1,否则为 0
  • ALPHA
  • 自定义
  • 1.29.0
selinux_warning_controller_selinux_volume_conflict
两个 Pod 使用同一卷时发生的冲突
  • ALPHA
  • 自定义
  • propertypod1_namespacepod1_namepod1_valuepod2_namespacepod2_namepod2_value
service_controller_loadbalancer_sync_total
一个指标,用于计算由于集群上的服务/节点更改而导致任何负载均衡器被配置的次数
  • ALPHA
  • 计数器
service_controller_nodesync_error_total
一个指标,用于计算由于集群上的节点更改而导致任何负载均衡器配置失败并出错的次数
  • ALPHA
  • 计数器
service_controller_nodesync_latency_seconds
一个指标,用于测量 nodesync 的延迟,它会在集群节点更新时更新负载均衡器主机。
  • ALPHA
  • 直方图
service_controller_update_loadbalancer_host_latency_seconds
一个指标,用于测量更新每个负载均衡器主机的延迟。
  • ALPHA
  • 直方图
serviceaccount_invalid_legacy_auto_token_uses_total
使用的无效自动生成的旧版令牌的累计数量
  • ALPHA
  • 计数器
serviceaccount_legacy_auto_token_uses_total
使用的自动生成的旧版令牌的累计数量
  • ALPHA
  • 计数器
serviceaccount_legacy_manual_token_uses_total
使用的手动创建的旧版令牌的累计数量
  • ALPHA
  • 计数器
serviceaccount_legacy_tokens_total
使用的旧版服务帐户令牌的累计数量
  • ALPHA
  • 计数器
serviceaccount_stale_tokens_total
使用的过时的 projected 服务帐户令牌的累计数量
  • ALPHA
  • 计数器
serviceaccount_valid_tokens_total
使用的有效 projected 服务帐户令牌的累计数量
  • ALPHA
  • 计数器
storage_count_attachable_volumes_in_use
衡量正在使用的卷的数量
  • ALPHA
  • 自定义
  • nodevolume_plugin
storage_operation_duration_seconds
存储操作持续时间
  • ALPHA
  • 直方图
  • migratedoperation_namestatusvolume_plugin
taint_eviction_controller_pod_deletion_duration_seconds
Pod 的污点效果被激活到通过 TaintEvictionController 删除 Pod 之间的时间延迟,以秒为单位。
  • ALPHA
  • 直方图
taint_eviction_controller_pod_deletions_total
自启动以来,TaintEvictionController 删除的 Pod 的总数。
  • ALPHA
  • 计数器
ttl_after_finished_controller_job_deletion_duration_seconds
自 Job 符合删除条件以来,删除 Job 所花费的时间
  • ALPHA
  • 直方图
volume_manager_selinux_container_errors_total
当 kubelet 无法计算容器的 SELinux 上下文时发生的错误数。kubelet 无法启动这样的 Pod,并且会重试,因此此指标的值可能不代表实际的容器数量。
  • ALPHA
  • 仪表盘
  • access_mode
volume_manager_selinux_container_warnings_total
当 kubelet 无法计算容器的 SELinux 上下文时发生的被忽略的错误数。当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,它们将变为真正的错误。
  • ALPHA
  • 仪表盘
  • access_mode
volume_manager_selinux_pod_context_mismatch_errors_total
当 Pod 为使用同一卷的容器定义不同的 SELinux 上下文时发生的错误数。kubelet 无法启动这样的 Pod,并且会重试,因此此指标的值可能不代表实际的 Pod 数量。
  • ALPHA
  • 仪表盘
  • access_mode
volume_manager_selinux_pod_context_mismatch_warnings_total
当 Pod 为使用同一卷的容器定义不同的 SELinux 上下文时发生的错误数。它们还不是错误,但是当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,它们将变为真正的错误。
  • ALPHA
  • 仪表盘
  • access_mode
volume_manager_selinux_volume_context_mismatch_errors_total
当 Pod 使用已使用与 Pod 所需的 SELinux 上下文不同的 SELinux 上下文挂载的卷时发生的错误数。kubelet 无法启动这样的 Pod,并且会重试,因此此指标的值可能不代表实际的 Pod 数量。
  • ALPHA
  • 仪表盘
  • access_modevolume_plugin
volume_manager_selinux_volume_context_mismatch_warnings_total
当 Pod 使用已使用与 Pod 所需的 SELinux 上下文不同的 SELinux 上下文挂载的卷时发生的错误数。它们还不是错误,但是当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,它们将变为真正的错误。
  • ALPHA
  • 仪表盘
  • access_modevolume_plugin
volume_manager_selinux_volumes_admitted_total
SELinux 上下文良好并将使用 mount -o context 选项挂载的卷的数量。
  • ALPHA
  • 仪表盘
  • access_modevolume_plugin
volume_manager_total_volumes
卷管理器中的卷的数量
  • ALPHA
  • 自定义
  • plugin_name(插件名称)state(状态)
volume_operation_total_errors
卷操作错误总数
  • ALPHA
  • 计数器
  • operation_nameplugin_name
volume_operation_total_seconds
存储操作端到端持续时间,以秒为单位
  • ALPHA
  • 直方图
  • operation_nameplugin_name
watch_cache_capacity
按资源类型划分的监视缓存的总容量。
  • ALPHA
  • 仪表盘
  • 资源
watch_cache_capacity_decrease_total
按资源类型划分的监视缓存容量减少事件的总数。
  • ALPHA
  • 计数器
  • 资源
watch_cache_capacity_increase_total
按资源类型划分的监视缓存容量增加事件的总数。
  • ALPHA
  • 计数器
  • 资源
workqueue_adds_total
工作队列处理的添加总数
  • ALPHA
  • 计数器
  • name
workqueue_depth
工作队列的当前深度
  • ALPHA
  • 仪表盘
  • name
workqueue_longest_running_processor_seconds
工作队列的最长运行处理器已运行的时间,以秒为单位。
  • ALPHA
  • 仪表盘
  • name
workqueue_queue_duration_seconds
一个项目在被请求之前在工作队列中停留的时间,以秒为单位。
  • ALPHA
  • 直方图
  • name
workqueue_retries_total
工作队列处理的重试总数
  • ALPHA
  • 计数器
  • name
workqueue_unfinished_work_seconds
已完成但尚未被 work_duration 观察到的正在进行中的工作时间,以秒为单位。较大的值表示线程卡住。可以通过观察此值的增加速率来推断卡住的线程数。
  • ALPHA
  • 仪表盘
  • name
workqueue_work_duration_seconds
从工作队列处理一个项目所花费的时间,以秒为单位。
  • ALPHA
  • 直方图
  • name

此页面是自动生成的。

如果您计划报告此页面的问题,请在问题描述中注明该页面是自动生成的。修复可能需要在 Kubernetes 项目中的其他位置进行。

上次修改时间:2024 年 11 月 11 日下午 9:01 PST: 更新 v1.32 版本的指标参考 (5144bd5ce4)