TPC-DS (2012)
Подобно бенчмарку Star Schema Benchmark (SSB), TPC-DS основан на TPC-H, но пошёл другим путём, т.е. увеличил количество соединений, необходимых для хранения данных в сложной снежинокообразной схеме (24 вместо 8 таблиц). Распределение данных искажено (например, нормальное и распределение Пуассона). Он включает в себя 99 отчетных и ад-хок запросов с случайными заменами.
Ссылки
- Создание TPC-DS (Nambiar), 2006
Сначала клонируйте репозиторий TPC-DS и скомпилируйте генератор данных:
Затем сгенерируйте данные. Параметр -scale
задает масштабный коэффициент.
Затем сгенерируйте запросы (используйте тот же масштабный коэффициент):
Теперь создайте таблицы в ClickHouse. Вы можете использовать либо оригинальные определения таблиц в tools/tpcds.sql, либо "настроенные" определения таблиц с правильно определенными индексами первичного ключа и типами колонок LowCardinality в тех местах, где это имеет смысл.
Данные можно импортировать следующим образом:
Затем выполните сгенерированные запросы.
TPC-DS активно использует коррелированные подзапросы, которые на момент написания (сентябрь 2024 года) не поддерживаются ClickHouse (issue #6697). В результате многие из приведенных выше тестовых запросов будут завершены с ошибками.