区切り記号の文字列。 delimiter がリテラルである場合は、それを一重引用符で囲みます。 part. TreasureDataが提供するPrestoには、smart_digest()というUDFがあります。 これは、文字列を短いハッシュ値に変える関数ですが、まだドキュメントに記載されていないそうです。 数値型ではなく文字列型でのJOINを行う際にはメモリ量をかなり削減できるため有用です。 この場合、対象のカラムが全て文字列型であるという大前提があるうえ、仮に全て文字列型の場合も、結合によって意図せず一致してしまうこともありえます。 分散 SQL クエリーエンジン Presto では、structural データ型の ROW 型を使うとシンプルにかけます。 CONCAT関数は、引数の文字列を連結した文字列を返すSQL関数です。 MySQLとHiveは2つ以上の引数でも動き、数値型カラムであれば自動的に文字列型へ変換されます。 配列型の結合にも使えますが重複要素が残るので、重複排除するためにはarray_union()を使います。 返す部分の位置 (1 からカウント)。1 以上の整数である必要があります。part が文字列のパート数より大きい場合、SPLIT_PART は空の文字列を返します。