SUUMOから情報を抽出する⑤ ~名前付きタグ~

SUUMOからの抽出

さて前回の記事までで、抽出以外の部分の準備が出来ましたので、今回はようやく抽出をしていきます!

これまで使っていない、かなり重要な機能を使いますので、今回も実践をしてしっかり覚えていきましょう!

住所を抽出する

まずは下のキャプチャの青枠のように、上のブランチのエンドステップ(×のステップ)をクリックします。

これから取得したい情報を抽出していきますが、ループの青枠の中から抽出をすることが大切ですので、上のキャプチャの赤枠のように、まずはループで設定した枠を探してきます。

ループで設定した枠を探したら、その枠の中から情報を取得していきますが、まずは住所を抽出してみます。

下のキャプチャのように必ずループの青枠の中から住所を選択します。

この選択した部分を右クリック→「抽出」でホバー→「テキスト」でホバー→「住所」の変数をクリックして、住所を抽出できます。

さて、以前も確認したことがありますが、今回もループを他の箇所に回しても、ちゃんと住所の位置を選択してくれているのかを確認します。

BizRobo!では、「住所を抽出するステップのファインダーを確認する」というような表現をします。

ファインダーを確認するためには、まず住所を抽出したステップ(下のキャプチャの赤枠)を選択します。

すると、キャプチャの下側のように、住所の場所がオレンジの枠で囲われていることが分かります。

このオレンジの枠を意識して確認をしながら、キャプチャの赤枠の「▶」をクリックしてループを進めていきます。

しばらくは順調に住所を囲ってくれているのですが、今回の僕の場合はイテレーション(ループの数字)が「4」になったら、こちらのキャプチャのように土地面積の部分を囲んでしまっています。

実は入れテーションが1~3までと、4以降では表示方法が変わってしまっていますので、同じポータルサイトの同じページであっても、このように構造が変わってしまうと表示内容が変わってしまい、単純に住所の箇所から抽出をするファインダー設定では、このようにファインダーがズレてしまう可能性があります。

名前付きタグを設定する

今回の記事のサブタイトルにも書いておりますが、このような場合に有効なのが名前付きタグを設定する機能です。

名前付きタグを設定した後に住所を抽出したいので、下のキャプチャの赤枠の、先ほど作成しました住所を抽出したステップを削除します。

ここから名前付きタグを設定していきますが、SUUMOの場合、「所在地」という項目の所に住所が記載されているので、まず所在地の箇所を選択します。

この所在地の箇所で右クリック→「その他」でホバー→「名前付きタグとして設定」をクリックすると、名前付きタグのステップが作られます。

ここで所在地のところには、2という数字が書かれた青枠が出てきました。

しかし、「2」という名前だと分かりづらいので、この「2」の箇所を「住所」に変更してみます。

まずは下のキャプチャの青枠「Set Named Tag」のステップをクリックし、キャプチャ赤枠のタグ名のところを変更していきます。

デフォルトは「自動」と入っていますが、こちらを「名前付き」に変更すると名前を入力するスペースが出てきますので、こちらに「住所」と入力します。

これで名前付きタグの名前が変更できましたので、下のキャプチャの青枠のエンドステップをクリックして、赤枠の部分を確認してみると、先ほどまで「2」となっていた箇所が「住所」に変更されています。

これで、まず名前付きタグの設定が出来ました。

名前付きタグのファインダーを設定する

ここまでで一旦、名前付きタグの設定が出来たのですが、これだけではまた構造が変わったタイミングでファインダーがズレてしまう可能性があるので、確実に「所在地」の箇所を選択してくれるようにファインダーを設定していきます。

ちゃんと青枠のように「Set Named Tag」のステップを選択していることを確認した上で、これも青枠の「ファインダー」をクリックします。

ファインダーの設定の中を少しスクロールすると、タグパターンという項目が出てきますので、こちらに「.*所在地.*」と入力をします。

こうすることで「所在地」というテキストを探して、その所在地と書かれている箇所に対して名前付きタグを設定してくれるようになります。

ここで使いました「.*」は、このSUUMOのシリーズで改めて解説をしていきますので、ここでは「.*所在地.*」と入力することで所在地というテキストを探してくれると、一旦覚えておいていただけたら有難いです。

すみません、タグパスの箇所も設定変更が必要だったのですが、その説明を忘れていました。

タグパターンよりも上にスクロールをしていただきますと、タグパスの入力スペースが出てきます。

こちらにはすでにBizRobo!側で入力をしてくれていますが、この中から「[2]」を削除します。

この番号は「2番目」というような意味なのですが、この記事の前半で確認をしたように構造が変わることがありますので、必ずしも2番目に所在地というテキストがあるとは限りません。

そのため、ここでしっかりと削除をしておきます。

名前付きタグを使って、住所を抽出する

ここまでで、まずは名前付きタグの設定ができましたので、この名前付きタグを活かして住所を抽出していきます。

名前付きタグを設定したステップの後で抽出をしたいので、下のキャプチャの青枠のようにエンドステップを選択していることを確認します。

そして、通常通り赤枠のように住所を選択して右クリック→「抽出」でホバー→「テキスト」でホバー→「住所」の変数をクリックして、住所を抽出します。

作成された住所を抽出するステップのファインダーを確認します。

下のキャプチャの赤枠の中を確認していきます。

こちらに2行入力されていますが、まず「名前付きタグ1で」と書かれていますが、ループの青枠に1と書かれていますので、「ループの範囲の中で」という意味になります。

また2行目には「名前付きタグ”住所”の後」と書かれています。

こちらは先ほど設定した、住所を抽出するための名前付きタグを探して、その後の部分から住所を抽出するということを意味しています。

今回は偶然、意図した通りの内容でファインダーが自動的に設定されていましたが、このような設定になっていなかった場合には、「+」や「ー」を使って意図した場所にファインダーが合うように設定をしてあげる必要があります。

次回予告

次回以降も住所以外の抽出をしていきますが、この名前付きタグを使うことを前提に進めていきます。

この名前付きタグの設定はかなり頻度高く使っていきますので、今後もこの記事を確認していただきながら進めていただけたら有難いです。

お楽しみに!!

タイトルとURLをコピーしました