Перейти к основному содержимому
Перейти к основному содержимому

BSONEachRow

ВходВыходПсевдоним

Описание

Формат BSONEachRow парсит данные как последовательность документов Binary JSON (BSON) без какого-либо разделителя между ними. Каждая строка форматируется как единственный документ, а каждая колонка форматируется как одно поле документа BSON с именем колонки в качестве ключа.

Соответствие типов данных

Для вывода используется следующее соответствие между типами ClickHouse и типами BSON:

Тип ClickHouseТип BSON
Bool\x08 булевый
Int8/UInt8/Enum8\x10 int32
Int16/UInt16/Enum16\x10 int32
Int32\x10 int32
UInt32\x12 int64
Int64/UInt64\x12 int64
Float32/Float64\x01 double
Date/Date32\x10 int32
DateTime\x12 int64
DateTime64\x09 datetime
Decimal32\x10 int32
Decimal64\x12 int64
Decimal128\x05 binary, \x00 двоичный подкласс, размер = 16
Decimal256\x05 binary, \x00 двоичный подкласс, размер = 32
Int128/UInt128\x05 binary, \x00 двоичный подкласс, размер = 16
Int256/UInt256\x05 binary, \x00 двоичный подкласс, размер = 32
String/FixedString\x05 binary, \x00 двоичный подкласс или \x02 строка, если настройка output_format_bson_string_as_string включена
UUID\x05 binary, \x04 uuid подкласс, размер = 16
Array\x04 массив
Tuple\x04 массив
Named Tuple\x03 документ
Map\x03 документ
IPv4\x10 int32
IPv6\x05 binary, \x00 двоичный подкласс

Для ввода используется следующее соответствие между типами BSON и типами ClickHouse:

Тип BSONТип ClickHouse
\x01 doubleFloat32/Float64
\x02 stringString/FixedString
\x03 documentMap/Named Tuple
\x04 arrayArray/Tuple
\x05 binary, \x00 двоичный подклассString/FixedString/IPv6
\x05 binary, \x02 старый двоичный подклассString/FixedString
\x05 binary, \x03 старый uuid подклассUUID
\x05 binary, \x04 uuid подклассUUID
\x07 ObjectIdString/FixedString
\x08 булевыйBool
\x09 datetimeDateTime64
\x0A нулевое значениеNULL
\x0D код JavaScriptString/FixedString
\x0E символString/FixedString
\x10 int32Int32/UInt32/Decimal32/IPv4/Enum8/Enum16
\x12 int64Int64/UInt64/Decimal64/DateTime64

Другие типы BSON не поддерживаются. Кроме того, производится преобразование между различными целочисленными типами. Например, возможно вставить значение BSON int32 в ClickHouse как UInt8.

Большие целые числа и десятичные числа, такие как Int128/UInt128/Int256/UInt256/Decimal128/Decimal256, могут быть распознаны из двоичного значения BSON с подтипом \x00. В этом случае формат будет проверять, что размер бинарных данных равен размеру ожидаемого значения.

примечание

Этот формат не работает должным образом на платформах Big-Endian.

Пример использования

Настройки формата

НастройкаОписаниеПо умолчанию
output_format_bson_string_as_stringИспользовать тип BSON String вместо Binary для строковых колонок.false
input_format_bson_skip_fields_with_unsupported_types_in_schema_inferenceПозволить пропускать колонки с неподдерживаемыми типами во время вывода схемы для формата BSONEachRow.false