Character型のデータの文字化けを直す方法

データをインポートすると、以下のように文字化けしていることがあります。これは、元データの文字コードがExploratoryが想定している「UTF-8」と異なるためです。

image

そういったときには、以下の手順に従ってiconv関数を使って文字エンコーディングを変換することで修正が可能です。

  1. 元のデータのエンコーディングを確認する。データベースからのデータであればデータベースの設定を確認し、ファイルからのインポートであればファイルをチェックしてください。なお今回は "Shift_JIS "でエンコーディングされている場合の例を紹介します。
  2. 列ヘッダーメニューから「計算の作成」、、「標準」を選択します。

image

  1. 計算エディタに以下の内容を入力します。なおfromの引数には必ず元のエンコード名を設定してください。またtoの引数には常にUTF-8を指定してください。
iconv(Status, from="Shift_JIS", to="UTF-8")

image

すると、正しいエンコーディングで変換されたデータで、新しい列が作成されます。

うまくいかない場合は、元のエンコーディングが間違っている可能性があるため、別のエンコーディングを試してください。

image

「いいね!」 2