業務の中で企業や担当者のリストを扱うことはよくありますが、部門ごとにリストが管理されていて、同じ会社であっても「株式会社ABC」「㈱ABC」「(株)ABC」といった表記の揺れがあって、同じ会社として認識できないことがよくあります。
このようなデータを利用していると、同一顧客に誤って2回連絡を差し上げてしまったり、複数のデータソースをつなぎ合わせて顧客のコンタクトリストを作成したいにもかかわらず、本来つながるべき情報が全くつながらないといった問題が発生してしまいます。あるいは売上を集計する際、適切な結果を得られない問題も生じます。
こうした問題を解決するためには、テキストデータを加工し、表記の揺れを統一する名寄せをする必要がありますが、例えば、Excelを使って名寄せをすると、複数の関数を組み合わせて手動で処理しなければならず、作業が煩雑でミスが起きやすいだけではなく、データ量が増えると処理待ちに時間がかかる問題が生じます。
そこで、名寄せをするときに、よくやる4つの処理を高速で行う方法を紹介する記事を公開しています。ぜひご覧ください!