approx_top_sum
Возвращает массив приблизительно наиболее частых значений и их количеств в указанной колонке. Полученный массив отсортирован по убыванию приблизительной частоты значений (не по самим значениям). Кроме того, учитывается вес значения.
Эта функция не предоставляет гарантированный результат. В некоторых ситуациях могут возникнуть ошибки, и она может вернуть частые значения, которые не являются наиболее частыми.
Рекомендуем использовать значение N < 10
; производительность снижается при больших значениях N
. Максимальное значение N = 65536
.
Параметры
N
— Количество элементов, которые нужно вернуть. Необязательный. Значение по умолчанию: 10.reserved
— Определяет, сколько ячеек зарезервировано для значений. Если uniq(column) > reserved, результат функции topK будет приблизительным. Необязательный. Значение по умолчанию: N * 3.
Аргументы
column
— Значение для расчета частоты.weight
— Вес. Каждое значение учитываетсяweight
раз для расчета частоты. UInt64.
Пример
Запрос:
Результат:
Смотрите также