Exploratory コミュニティ

テキストデータの加工のUIで「立」という文字列を識別できない場合の回避策

#1

文字列の中に「⽴」があった場合、テキストデータの加工のメニューでこの「立」を含むものを探した際に、「立」を指定してもマッチできないことがあります。

これは「立」には2種類のユニコードがあるからです。一般的には以下のU+78ACBが使われますが、

U+7ACB,

稀に以下のU+2F74のものが使われているケースがあります。

U+2F74,

この場合、キーボードで入力した「立」はU+7ACBなので、U+2F74のものとマッチさせることができません。

明示的にU+2F74を指定するするとマッチさせることができます。

image

また、テキストデータの加工で、全角 / 半角の統一(正規化)で、U+7ACBのものに変換することもできます。

image

image