Перейти к основному содержимому
Перейти к основному содержимому

TPC-DS (2012)

Подобно бенчмарку Star Schema Benchmark (SSB), TPC-DS основан на TPC-H, но пошёл другим путём, т.е. увеличил количество соединений, необходимых для хранения данных в сложной снежинокообразной схеме (24 вместо 8 таблиц). Распределение данных искажено (например, нормальное и распределение Пуассона). Он включает в себя 99 отчетных и ад-хок запросов с случайными заменами.

Ссылки

Сначала клонируйте репозиторий TPC-DS и скомпилируйте генератор данных:

Затем сгенерируйте данные. Параметр -scale задает масштабный коэффициент.

Затем сгенерируйте запросы (используйте тот же масштабный коэффициент):

Теперь создайте таблицы в ClickHouse. Вы можете использовать либо оригинальные определения таблиц в tools/tpcds.sql, либо "настроенные" определения таблиц с правильно определенными индексами первичного ключа и типами колонок LowCardinality в тех местах, где это имеет смысл.

Данные можно импортировать следующим образом:

Затем выполните сгенерированные запросы.

осторожно

TPC-DS активно использует коррелированные подзапросы, которые на момент написания (сентябрь 2024 года) не поддерживаются ClickHouse (issue #6697). В результате многие из приведенных выше тестовых запросов будут завершены с ошибками.