CSVやExcelファイルのインポート&マージを実行した時に特定のデータが欠損値になってしまう

CSVやExcelファイルのインポート&マージを実行した時に特定のデータのみ欠損値になってしまうことがあります。

image

よくある原因としては、インポート対象のデータ側で列名が異なっている時に発生します。

以下の例では、データ自体は同じ構成となっていますが、それぞれのデータで列名が異なります。

データ1:

image

データ2:

image

これによってインポート&マージを実行した時に、同じ情報を表す列だったとしても別々の列としてインポートされるために欠損値となってしまいます。

image

そのため、対処法としては以下となります。

インポート時に「1行目を列名にする」を「いいえ」として設定する

インポート&マージでデータをインポートする時に、インポートダイアログの設定にある「1行目を列名にする」を「いいえ」として設定することで、元のデータの列名に関係なしに列の順番としてインポートができるようになります。

image

インポート後に特定の行を列名にしたい場合は、ステップメニューから「その他」の「指定した行を列名にする」を選択します。

image

列名にしたい行番号を指定して実行することで、その行の情報を列名として設定することが可能です。

image

元データの列名を事前に調整する

Exploratory側で対処する方法としては、上記のインポート時に「1行目を列名にする」を「いいえ」として設定する方法となりますが、もし元データの方から見直しをしたい場合は、CSVやExcelファイルの列名を事前に調整をしてからインポート&マージを行ってください。