Трассировка ClickHouse с OpenTelemetry
OpenTelemetry является открытым стандартом для сбора трасс и метрик из распределенного приложения. ClickHouse имеет некоторую поддержку OpenTelemetry.
Поставка контекста трассировки в ClickHouse
ClickHouse принимает заголовки HTTP контекста трассировки, как описано в рекомендациях W3C. Он также принимает контекст трассировки через нативный протокол, который используется для связи между серверами ClickHouse или между клиентом и сервером. Для ручного тестирования заголовки контекста трассировки, соответствующие рекомендации по контексту трассировки, могут быть переданы в clickhouse-client
, используя флаги --opentelemetry-traceparent
и --opentelemetry-tracestate
.
Если родительский контекст трассировки не предоставлен или предоставленный контекст трассировки не соответствует стандарту W3C, ClickHouse может начать новую трассировку, вероятность которой контролируется настройкой opentelemetry_start_trace_probability.
Пропаганда контекста трассировки
Контекст трассировки передается на последующие сервисы в следующих случаях:
-
Запросы к удаленным серверам ClickHouse, например, при использовании движка таблиц Distributed.
-
Табличная функция url. Информация о контексте трассировки отправляется в HTTP заголовках.
Трассировка самого ClickHouse
ClickHouse создает trace spans
для каждого запроса и некоторых этапов выполнения запроса, таких как планирование запроса или распределенные запросы.
Чтобы быть полезной, информация о трассировке должна экспортироваться в систему мониторинга, которая поддерживает OpenTelemetry, такую как Jaeger или Prometheus. ClickHouse избегает зависимости от конкретной системы мониторинга, предоставляя данные трассировки только через системную таблицу. Информация о трассировке требуемая стандартом хранится в таблице system.opentelemetry_span_log.
Эта таблица должна быть включена в конфигурации сервера, смотрите элемент opentelemetry_span_log
в файле конфигурации по умолчанию config.xml
. Она включена по умолчанию.
Теги или атрибуты сохраняются как два параллельных массива, содержащих ключи и значения. Используйте ARRAY JOIN для работы с ними.
Настройки логирования запросов
Установка log_query_settings позволяет логировать изменения настроек запроса в течение выполнения запроса. Когда функция активирована, любые изменения в настройках запроса будут записаны в журнал трассировки OpenTelemetry. Эта функция особенно полезна в производственных средах для отслеживания изменений конфигурации, которые могут повлиять на производительность запросов.
Интеграция с системами мониторинга
На данный момент не существует готового инструмента, который мог бы экспортировать данные трассировки из ClickHouse в систему мониторинга.
Для тестирования можно настроить экспорт, используя материализованное представление с движком URL над таблицей system.opentelemetry_span_log, что позволит отправлять данные журнала на HTTP-эндпоинт сборщика трасс. Например, чтобы отправить минимальные данные о спанах на экземпляр Zipkin, работающий по адресу http://localhost:9411
, в формате JSON v2 Zipkin:
В случае любых ошибок часть данных журнала, для которой произошла ошибка, будет тихо утеряна. Проверьте журнал сервера на наличие сообщений об ошибках, если данные не поступают.