Exploratory コミュニティ

一つの列に複数の値が区切られて入っている場合に、区切り文字を指定して「N番目の単語を取り出す」方法

#1

データを加工する前では、一つの列に複数の値が区切られて入っている場合があります。

そこで、ある特定の順番にある単語を取り出したいとします。

例えば、州と市のデータが一つの列に入っていて、コンマ(,)で区切られているとします。
州のデータは2番目にあるため、この2番目の単語のみを取り出すことができれば、州のデータのみにすることができます。

列ヘッダメニューから「テキストを操作」、「N番目の単語を取り出す」を選びます。

すると以下のようなダイアログが開きますので、2番目が州なので、2を指定し、区切り文字(sep)にカンマ(,)を指定します。

すると、以下のように州だけとなります。