Add SQL function CASEFOLD().

author Jeff Davis <[email protected]>
Fri, 24 Jan 2025 22:56:22 +0000 (14:56 -0800)
committer Jeff Davis <[email protected]>
Fri, 24 Jan 2025 22:56:22 +0000 (14:56 -0800)
diff --git a/doc/src/sgml/func.sgml b/doc/src/sgml/func.sgml
index 5678e7621a57cf2ab4a3e4d7d21dc0a2000344e0..d2b0b059e6594ef82570de24022116edc8dd197c 100644 (file)
--- a/doc/src/sgml/func.sgml
+++ b/doc/src/sgml/func.sgml
@@ -2596,7 +2596,7 @@ SELECT NOT(ROW(table.*) IS NOT NULL) FROM TABLE; -- detect at least one null in
  
        <row>
         <entry role="func_table_entry"><para role="func_signature">
-        <indexterm>
+        <indexterm id="function-lower">
           <primary>lower</primary>
          </indexterm>
          <function>lower</function> ( <type>text</type> )
@@ -2657,7 +2657,7 @@ SELECT NOT(ROW(table.*) IS NOT NULL) FROM TABLE; -- detect at least one null in
  
        <row>
         <entry role="func_table_entry"><para role="func_signature">
-        <indexterm>
+        <indexterm id="function-normalize">
           <primary>normalize</primary>
          </indexterm>
          <indexterm>
@@ -3109,6 +3109,48 @@ SELECT NOT(ROW(table.*) IS NOT NULL) FROM TABLE; -- detect at least one null in
         </para></entry>
        </row>
  
+      <row>
+       <entry role="func_table_entry"><para role="func_signature">
+        <indexterm>
+         <primary>casefold</primary>
+        </indexterm>
+        <function>casefold</function> ( <type>text</type> )
+        <returnvalue>text</returnvalue>
+       </para>
+       <para>
+        Performs case folding of the input string according to the collation.
+        Case folding is similar to case conversion, but the purpose of case
+        folding is to facilitate case-insensitive comparison of strings,
+        whereas the purpose of case conversion is to convert to a particular
+        cased form.  This function can only be used when the server encoding
+        is <literal>UTF8</literal>.
+       </para>
+       <para>
+        Ordinarily, case folding simply converts to lowercase, but there are a
+        few notable exceptions depending on the collation.  For instance, the
+        character <literal>Σ</literal> (U+03A3) has two lowercase forms:
+        <literal>σ</literal> (U+03C3) and <literal>ς</literal> (U+03C2); case
+        folding in the <literal>PG_C_UTF8</literal> collation maps all three
+        forms to <literal>σ</literal>.  Additionally, the result is not
+        necessarily lowercase; some characters may be folded to uppercase.
+       </para>
+       <para>
+        Case folding may change the length of the string.  For instance, in
+        the <literal>PG_UNICODE_FAST</literal> collation, <literal>ß</literal>
+        (U+00DF) folds to <literal>ss</literal>.
+       </para>
+       <para>
+        <function>casefold</function> can be used for Unicode Default Caseless
+        Matching.  It does not always preserve the normalized form of the
+        input string (see <xref linkend="function-normalize"/>).
+       </para>
+       <para>
+        The <literal>libc</literal> provider doesn't support case folding, so
+        <function>casefold</function> is identical to <xref
+        linkend="function-lower"/>.
+       </para></entry>
+      </row>
+
        <row>
         <entry role="func_table_entry"><para role="func_signature">
          <indexterm>
diff --git a/src/backend/utils/adt/formatting.c b/src/backend/utils/adt/formatting.c
index 7c4c4aa07d56e6162da69ac604f5ddd9fe825c75..2720d3902abd7870c7c709c1f4c8bb0ffbf0e876 100644 (file)
--- a/src/backend/utils/adt/formatting.c
+++ b/src/backend/utils/adt/formatting.c
@@ -1819,6 +1819,75 @@ str_initcap(const char *buff, size_t nbytes, Oid collid)
     return result;
  }
  
+/*
+ * collation-aware, wide-character-aware case folding
+ *
+ * We pass the number of bytes so we can pass varlena and char*
+ * to this function.  The result is a palloc'd, null-terminated string.
+ */
+char *
+str_casefold(const char *buff, size_t nbytes, Oid collid)
+{
+   char       *result;
+   pg_locale_t mylocale;
+
+   if (!buff)
+       return NULL;
+
+   if (!OidIsValid(collid))
+   {
+       /*
+        * This typically means that the parser could not resolve a conflict
+        * of implicit collations, so report it that way.
+        */
+       ereport(ERROR,
+               (errcode(ERRCODE_INDETERMINATE_COLLATION),
+                errmsg("could not determine which collation to use for %s function",
+                       "lower()"),
+                errhint("Use the COLLATE clause to set the collation explicitly.")));
+   }
+
+   if (GetDatabaseEncoding() != PG_UTF8)
+       ereport(ERROR,
+               (errcode(ERRCODE_SYNTAX_ERROR),
+                errmsg("Unicode case folding can only be performed if server encoding is UTF8")));
+
+   mylocale = pg_newlocale_from_collation(collid);
+
+   /* C/POSIX collations use this path regardless of database encoding */
+   if (mylocale->ctype_is_c)
+   {
+       result = asc_tolower(buff, nbytes);
+   }
+   else
+   {
+       const char *src = buff;
+       size_t      srclen = nbytes;
+       size_t      dstsize;
+       char       *dst;
+       size_t      needed;
+
+       /* first try buffer of equal size plus terminating NUL */
+       dstsize = srclen + 1;
+       dst = palloc(dstsize);
+
+       needed = pg_strfold(dst, dstsize, src, srclen, mylocale);
+       if (needed + 1 > dstsize)
+       {
+           /* grow buffer if needed and retry */
+           dstsize = needed + 1;
+           dst = repalloc(dst, dstsize);
+           needed = pg_strfold(dst, dstsize, src, srclen, mylocale);
+           Assert(needed + 1 <= dstsize);
+       }
+
+       Assert(dst[needed] == '\0');
+       result = dst;
+   }
+
+   return result;
+}
+
  /*
   * ASCII-only lower function
   *
diff --git a/src/backend/utils/adt/oracle_compat.c b/src/backend/utils/adt/oracle_compat.c
index 2cba7cd1621158efa4249fd8ab15bda0e54a2e1c..a24a2d208fba71a603d19ea724691cadf4426795 100644 (file)
--- a/src/backend/utils/adt/oracle_compat.c
+++ b/src/backend/utils/adt/oracle_compat.c
@@ -126,6 +126,22 @@ initcap(PG_FUNCTION_ARGS)
     PG_RETURN_TEXT_P(result);
  }
  
+Datum
+casefold(PG_FUNCTION_ARGS)
+{
+   text       *in_string = PG_GETARG_TEXT_PP(0);
+   char       *out_string;
+   text       *result;
+
+   out_string = str_casefold(VARDATA_ANY(in_string),
+                             VARSIZE_ANY_EXHDR(in_string),
+                             PG_GET_COLLATION());
+   result = cstring_to_text(out_string);
+   pfree(out_string);
+
+   PG_RETURN_TEXT_P(result);
+}
+
  
  /********************************************************************
   *
diff --git a/src/backend/utils/adt/pg_locale.c b/src/backend/utils/adt/pg_locale.c
index 94444acd2c5daf768e75e1891a5b1542309a7ae6..7d92f580a57472cc91632b643f08e84dd4ac115d 100644 (file)
--- a/src/backend/utils/adt/pg_locale.c
+++ b/src/backend/utils/adt/pg_locale.c
@@ -106,6 +106,8 @@ extern size_t strtitle_builtin(char *dst, size_t dstsize, const char *src,
                                ssize_t srclen, pg_locale_t locale);
  extern size_t strupper_builtin(char *dst, size_t dstsize, const char *src,
                                ssize_t srclen, pg_locale_t locale);
+extern size_t strfold_builtin(char *dst, size_t dstsize, const char *src,
+                             ssize_t srclen, pg_locale_t locale);
  
  extern size_t strlower_icu(char *dst, size_t dstsize, const char *src,
                            ssize_t srclen, pg_locale_t locale);
@@ -113,6 +115,8 @@ extern size_t strtitle_icu(char *dst, size_t dstsize, const char *src,
                            ssize_t srclen, pg_locale_t locale);
  extern size_t strupper_icu(char *dst, size_t dstsize, const char *src,
                            ssize_t srclen, pg_locale_t locale);
+extern size_t strfold_icu(char *dst, size_t dstsize, const char *src,
+                         ssize_t srclen, pg_locale_t locale);
  
  extern size_t strlower_libc(char *dst, size_t dstsize, const char *src,
                             ssize_t srclen, pg_locale_t locale);
@@ -1447,6 +1451,26 @@ pg_strupper(char *dst, size_t dstsize, const char *src, ssize_t srclen,
     return 0;                   /* keep compiler quiet */
  }
  
+size_t
+pg_strfold(char *dst, size_t dstsize, const char *src, ssize_t srclen,
+          pg_locale_t locale)
+{
+   if (locale->provider == COLLPROVIDER_BUILTIN)
+       return strfold_builtin(dst, dstsize, src, srclen, locale);
+#ifdef USE_ICU
+   else if (locale->provider == COLLPROVIDER_ICU)
+       return strfold_icu(dst, dstsize, src, srclen, locale);
+#endif
+   /* for libc, just use strlower */
+   else if (locale->provider == COLLPROVIDER_LIBC)
+       return strlower_libc(dst, dstsize, src, srclen, locale);
+   else
+       /* shouldn't happen */
+       PGLOCALE_SUPPORT_ERROR(locale->provider);
+
+   return 0;                   /* keep compiler quiet */
+}
+
  /*
   * pg_strcoll
   *
diff --git a/src/backend/utils/adt/pg_locale_builtin.c b/src/backend/utils/adt/pg_locale_builtin.c
index 436e32c0ca01f3cda1b3d2b2aef45ed2aa88feb3..33ad20bbf07c98292ffcc5d6b059753a3ac4f431 100644 (file)
--- a/src/backend/utils/adt/pg_locale_builtin.c
+++ b/src/backend/utils/adt/pg_locale_builtin.c
@@ -31,6 +31,8 @@ extern size_t strtitle_builtin(char *dst, size_t dstsize, const char *src,
                                ssize_t srclen, pg_locale_t locale);
  extern size_t strupper_builtin(char *dst, size_t dstsize, const char *src,
                                ssize_t srclen, pg_locale_t locale);
+extern size_t strfold_builtin(char *dst, size_t dstsize, const char *src,
+                             ssize_t srclen, pg_locale_t locale);
  
  
  struct WordBoundaryState
@@ -107,6 +109,14 @@ strupper_builtin(char *dest, size_t destsize, const char *src, ssize_t srclen,
                             locale->info.builtin.casemap_full);
  }
  
+size_t
+strfold_builtin(char *dest, size_t destsize, const char *src, ssize_t srclen,
+               pg_locale_t locale)
+{
+   return unicode_strfold(dest, destsize, src, srclen,
+                          locale->info.builtin.casemap_full);
+}
+
  pg_locale_t
  create_pg_locale_builtin(Oid collid, MemoryContext context)
  {
diff --git a/src/backend/utils/adt/pg_locale_icu.c b/src/backend/utils/adt/pg_locale_icu.c
index 5185b0f728911fd3ddf4d452360028677301957d..b0c73f2e43d01adc0c21803521ba389bdb090032 100644 (file)
--- a/src/backend/utils/adt/pg_locale_icu.c
+++ b/src/backend/utils/adt/pg_locale_icu.c
@@ -54,6 +54,8 @@ extern size_t strtitle_icu(char *dst, size_t dstsize, const char *src,
                            ssize_t srclen, pg_locale_t locale);
  extern size_t strupper_icu(char *dst, size_t dstsize, const char *src,
                            ssize_t srclen, pg_locale_t locale);
+extern size_t strfold_icu(char *dst, size_t dstsize, const char *src,
+                         ssize_t srclen, pg_locale_t locale);
  
  #ifdef USE_ICU
  
@@ -117,6 +119,10 @@ static int32_t u_strToTitle_default_BI(UChar *dest, int32_t destCapacity,
                                        const UChar *src, int32_t srcLength,
                                        const char *locale,
                                        UErrorCode *pErrorCode);
+static int32_t u_strFoldCase_default(UChar *dest, int32_t destCapacity,
+                                    const UChar *src, int32_t srcLength,
+                                    const char *locale,
+                                    UErrorCode *pErrorCode);
  
  static const struct collate_methods collate_methods_icu = {
     .strncoll = strncoll_icu,
@@ -439,6 +445,26 @@ strupper_icu(char *dest, size_t destsize, const char *src, ssize_t srclen,
     return result_len;
  }
  
+size_t
+strfold_icu(char *dest, size_t destsize, const char *src, ssize_t srclen,
+           pg_locale_t locale)
+{
+   int32_t     len_uchar;
+   int32_t     len_conv;
+   UChar      *buff_uchar;
+   UChar      *buff_conv;
+   size_t      result_len;
+
+   len_uchar = icu_to_uchar(&buff_uchar, src, srclen);
+   len_conv = icu_convert_case(u_strFoldCase_default, locale,
+                               &buff_conv, buff_uchar, len_uchar);
+   result_len = icu_from_uchar(dest, destsize, buff_conv, len_conv);
+   pfree(buff_uchar);
+   pfree(buff_conv);
+
+   return result_len;
+}
+
  /*
   * strncoll_icu_utf8
   *
@@ -673,6 +699,38 @@ u_strToTitle_default_BI(UChar *dest, int32_t destCapacity,
                         NULL, locale, pErrorCode);
  }
  
+static int32_t
+u_strFoldCase_default(UChar *dest, int32_t destCapacity,
+                     const UChar *src, int32_t srcLength,
+                     const char *locale,
+                     UErrorCode *pErrorCode)
+{
+   uint32      options = U_FOLD_CASE_DEFAULT;
+   char        lang[3];
+   UErrorCode  status;
+
+   /*
+    * Unlike the ICU APIs for lowercasing, titlecasing, and uppercasing, case
+    * folding does not accept a locale. Instead it just supports a single
+    * option relevant to Turkic languages 'az' and 'tr'; check for those
+    * languages to enable the option.
+    */
+   status = U_ZERO_ERROR;
+   uloc_getLanguage(locale, lang, 3, &status);
+   if (U_SUCCESS(status))
+   {
+       /*
+        * The option name is confusing, but it causes u_strFoldCase to use
+        * the 'T' mappings, which are ignored for U_FOLD_CASE_DEFAULT.
+        */
+       if (strcmp(lang, "tr") == 0 || strcmp(lang, "az") == 0)
+           options = U_FOLD_CASE_EXCLUDE_SPECIAL_I;
+   }
+
+   return u_strFoldCase(dest, destCapacity, src, srcLength,
+                        options, pErrorCode);
+}
+
  /*
   * strncoll_icu
   *
diff --git a/src/include/catalog/catversion.h b/src/include/catalog/catversion.h
index 586b83f2f4d62c1bc72895f8dd2e2a200811b986..e3a308024de3a3302cedbf6e71a5bac412b9761b 100644 (file)
--- a/src/include/catalog/catversion.h
+++ b/src/include/catalog/catversion.h
@@ -57,6 +57,6 @@
   */
  
  /*                         yyyymmddN */
-#define CATALOG_VERSION_NO 202501231
+#define CATALOG_VERSION_NO 202501232
  
  #endif
diff --git a/src/include/catalog/pg_proc.dat b/src/include/catalog/pg_proc.dat
index 18560755d26f4742d02a847793f100d845fe961a..2aafdbc3e9365e908e817dd362e72b2aca0e2145 100644 (file)
--- a/src/include/catalog/pg_proc.dat
+++ b/src/include/catalog/pg_proc.dat
@@ -3623,6 +3623,9 @@
  { oid => '872', descr => 'capitalize each word',
    proname => 'initcap', prorettype => 'text', proargtypes => 'text',
    prosrc => 'initcap' },
+{ oid => '9569', descr => 'fold case',
+  proname => 'casefold', prorettype => 'text', proargtypes => 'text',
+  prosrc => 'casefold' },
  { oid => '873', descr => 'left-pad string to length',
    proname => 'lpad', prorettype => 'text', proargtypes => 'text int4 text',
    prosrc => 'lpad' },
diff --git a/src/include/utils/formatting.h b/src/include/utils/formatting.h
index 5fa49539aaab4a58eb49fa07bbdb57fefb7c836e..835307dac0935829f5637745b841df9637bfa43c 100644 (file)
--- a/src/include/utils/formatting.h
+++ b/src/include/utils/formatting.h
@@ -21,6 +21,7 @@
  extern char *str_tolower(const char *buff, size_t nbytes, Oid collid);
  extern char *str_toupper(const char *buff, size_t nbytes, Oid collid);
  extern char *str_initcap(const char *buff, size_t nbytes, Oid collid);
+extern char *str_casefold(const char *buff, size_t nbytes, Oid collid);
  
  extern char *asc_tolower(const char *buff, size_t nbytes);
  extern char *asc_toupper(const char *buff, size_t nbytes);
diff --git a/src/include/utils/pg_locale.h b/src/include/utils/pg_locale.h
index 2bc3a7df2d9076b1c023968ae77449d5f674ee68..0d5f0513cebab00a18aae6e7d0fb0ec0f88283e6 100644 (file)
--- a/src/include/utils/pg_locale.h
+++ b/src/include/utils/pg_locale.h
@@ -134,6 +134,9 @@ extern size_t pg_strtitle(char *dest, size_t destsize,
  extern size_t pg_strupper(char *dest, size_t destsize,
                           const char *src, ssize_t srclen,
                           pg_locale_t locale);
+extern size_t pg_strfold(char *dest, size_t destsize,
+                        const char *src, ssize_t srclen,
+                        pg_locale_t locale);
  extern int pg_strcoll(const char *arg1, const char *arg2, pg_locale_t locale);
  extern int pg_strncoll(const char *arg1, ssize_t len1,
                         const char *arg2, ssize_t len2, pg_locale_t locale);
diff --git a/src/test/regress/expected/collate.icu.utf8.out b/src/test/regress/expected/collate.icu.utf8.out
index d4f327636fd5fe01402e2ae99ccca3f1fb302231..910de9120f2cfa2a033b46baf753c2fdef78d1b7 100644 (file)
--- a/src/test/regress/expected/collate.icu.utf8.out
+++ b/src/test/regress/expected/collate.icu.utf8.out
@@ -255,6 +255,30 @@ SELECT a, x, y FROM collate_test10 ORDER BY lower(y), a;
   1 | hij | hij
  (2 rows)
  
+SELECT lower('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' COLLATE "en-x-icu");
+             lower             
+-------------------------------
+ abcd 123 #$% ıiii̇ ß ß ǆǆǆ σσς
+(1 row)
+
+SELECT casefold('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' COLLATE "en-x-icu");
+            casefold             
+---------------------------------
+ abcd 123 #$% ıiii̇ ss ss ǆǆǆ σσσ
+(1 row)
+
+SELECT lower('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' COLLATE "tr-x-icu");
+             lower             
+-------------------------------
+ abcd 123 #$% ıiıi ß ß ǆǆǆ σσς
+(1 row)
+
+SELECT casefold('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' COLLATE "tr-x-icu");
+            casefold             
+---------------------------------
+ abcd 123 #$% ıiıi ss ss ǆǆǆ σσσ
+(1 row)
+
  -- LIKE/ILIKE
  SELECT * FROM collate_test1 WHERE b LIKE 'abc';
   a |  b  
diff --git a/src/test/regress/expected/collate.utf8.out b/src/test/regress/expected/collate.utf8.out
index 8b7176a27568559c804e38f9949cbbc33eafc87d..5508622b16d0113480c8f92f59aebee2422ef57f 100644 (file)
--- a/src/test/regress/expected/collate.utf8.out
+++ b/src/test/regress/expected/collate.utf8.out
@@ -160,6 +160,13 @@ SELECT 'δ' ~* '[Γ-Λ]' COLLATE PG_C_UTF8; -- same as above with cases reversed
   t
  (1 row)
  
+-- case folding
+select casefold('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' collate PG_C_UTF8);
+           casefold            
+-------------------------------
+ abcd 123 #$% ıiiİ ß ß ǆǆǆ σσσ
+(1 row)
+
  --
  -- Test PG_UNICODE_FAST
  --
@@ -320,3 +327,10 @@ SELECT 'δ' ~* '[Γ-Λ]' COLLATE PG_UNICODE_FAST; -- same as above with cases re
   t
  (1 row)
  
+-- case folding
+select casefold('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' collate PG_UNICODE_FAST);
+            casefold             
+---------------------------------
+ abcd 123 #$% ıiii̇ ss ss ǆǆǆ σσσ
+(1 row)
+
diff --git a/src/test/regress/sql/collate.icu.utf8.sql b/src/test/regress/sql/collate.icu.utf8.sql
index 5ee2da4e0e09e9d77788062b84a4e50979fe6904..f99f186f2d65ac7ead55699f9343691c12683798 100644 (file)
--- a/src/test/regress/sql/collate.icu.utf8.sql
+++ b/src/test/regress/sql/collate.icu.utf8.sql
@@ -116,6 +116,11 @@ SELECT a, lower(x COLLATE "C"), lower(y COLLATE "C") FROM collate_test10;
  
  SELECT a, x, y FROM collate_test10 ORDER BY lower(y), a;
  
+SELECT lower('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' COLLATE "en-x-icu");
+SELECT casefold('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' COLLATE "en-x-icu");
+SELECT lower('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' COLLATE "tr-x-icu");
+SELECT casefold('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' COLLATE "tr-x-icu");
+
  -- LIKE/ILIKE
  
  SELECT * FROM collate_test1 WHERE b LIKE 'abc';
diff --git a/src/test/regress/sql/collate.utf8.sql b/src/test/regress/sql/collate.utf8.sql
index 46e9c5232ad1c2cfbca0f1f037d7c4cacf85e043..6c7c7aec9ec32bac7ed0a3676d8761a70c397336 100644 (file)
--- a/src/test/regress/sql/collate.utf8.sql
+++ b/src/test/regress/sql/collate.utf8.sql
@@ -81,6 +81,9 @@ SELECT 'xAb' !~* '[c-d]' COLLATE PG_C_UTF8;
  SELECT 'Δ' ~* '[γ-λ]' COLLATE PG_C_UTF8;
  SELECT 'δ' ~* '[Γ-Λ]' COLLATE PG_C_UTF8; -- same as above with cases reversed
  
+-- case folding
+select casefold('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' collate PG_C_UTF8);
+
  --
  -- Test PG_UNICODE_FAST
  --
@@ -140,3 +143,6 @@ SELECT 'xAb' ~* '[W-Y]' COLLATE PG_UNICODE_FAST;
  SELECT 'xAb' !~* '[c-d]' COLLATE PG_UNICODE_FAST;
  SELECT 'Δ' ~* '[γ-λ]' COLLATE PG_UNICODE_FAST;
  SELECT 'δ' ~* '[Γ-Λ]' COLLATE PG_UNICODE_FAST; -- same as above with cases reversed
+
+-- case folding
+select casefold('AbCd 123 #$% ıiIİ ẞ ß Ǆǅǆ Σσς' collate PG_UNICODE_FAST);
author	Jeff Davis <[email protected]>
	Fri, 24 Jan 2025 22:56:22 +0000 (14:56 -0800)
committer	Jeff Davis <[email protected]>
	Fri, 24 Jan 2025 22:56:22 +0000 (14:56 -0800)
doc/src/sgml/func.sgml		\| blob \| blame \| history
src/backend/utils/adt/formatting.c		\| blob \| blame \| history
src/backend/utils/adt/oracle_compat.c		\| blob \| blame \| history
src/backend/utils/adt/pg_locale.c		\| blob \| blame \| history
src/backend/utils/adt/pg_locale_builtin.c		\| blob \| blame \| history
src/backend/utils/adt/pg_locale_icu.c		\| blob \| blame \| history
src/include/catalog/catversion.h		\| blob \| blame \| history
src/include/catalog/pg_proc.dat		\| blob \| blame \| history
src/include/utils/formatting.h		\| blob \| blame \| history
src/include/utils/pg_locale.h		\| blob \| blame \| history
src/test/regress/expected/collate.icu.utf8.out		\| blob \| blame \| history
src/test/regress/expected/collate.utf8.out		\| blob \| blame \| history
src/test/regress/sql/collate.icu.utf8.sql		\| blob \| blame \| history
src/test/regress/sql/collate.utf8.sql		\| blob \| blame \| history