Exploratory コミュニティ

URLの列からページタイトルの列を作成する方法

#1

以下のようにURLのデータがある列から、そのURLのページタイトルの列を作成する方法を紹介します。

image

ステップメニューから、カスタムRコマンドを選択します。

image

カスタRコマンドのダイアログが表示されたら、
以下コードをコピーして、貼り付けます。

mutate(<ページタイトルの列名> = purrr::map(<urlの列名>,
function(x){
rvest::html_text2(
rvest::html_element(rvest::read_html(x), "title")
)
})) %>% unnest()

このとき、<ページタイトルの列名>と<urlの列名>はご自身のデータに合わせた内容にご変更ください。

なお今回は、ページタイトルの列名を「title」、urlの列名は「url」となるので、
以下の内容でコードを貼り付け実行します。

image

ページタイトルの列を以下のように追加できます。

image

2 Likes