SUUMOから情報を抽出する① ~情報抽出の基本・実行モード~

SUUMOからの抽出

前回まではYahooファイナンスから株価を抽出してExcelに出力することをBizRobo!で自動化をしてきました。

やはりWEBからの抽出ということがBizRobo!の強みでもあるため、引き続きWEBからの抽出として、SUUMOのサイトからの抽出をするロボットを開発していきます!

Yahooファイナンスの記事とは少し違う角度からロボット開発をしていきますので、色々なパターンでのロボット開発をお伝えしたいです!

ポータルサイトからの情報抽出が基本

WEBからの情報収集というと、人が情報収集を行う場合には、Googleでキーワード検索をしてヒットしたサイトを調べていくことが多いです。

しかし、実はBizRobo!のようなRPAで情報収集をしていく上では、その方法は安定して情報収集をしていくことは出来ません。

というのも、サイトごとに作りが異なりますので、1つのサイトで情報収集が出来るようにロボットを開発しても、他のサイトに移ると上手く情報収集が出来ないということが多いです。

そのためRPAでWEBサイトからの情報収集を行う場合には、例えば住宅情報を収集するならSUUMO、転職情報を収集するならリクナビネクスト、などとポータルサイトからの情報収集が基本となります。

同じポータルサイトの中であれば、基本的にはほぼ作りは同じなので、そのポータルサイトから情報収集を行うロボットを1回開発してしまえば、その仕様のロボットで情報収集を行うことが出来ます。

もちろんサイトの構造が変わることも稀にありますので、そのタイミングでロボットが上手く実行できなくなった場合には、新しいサイトの構造に合わせてロボットを修正していく必要があります。

ロボットを作成する

RPAで情報収集を行う上で、ポータルサイトからの情報収集が効果的と分かったところで、SUUMOから情報収集を行うロボットを作っていきます!

僕の場合には、ブログ用に「DEMO」というプロジェクトの中にロボットを作成していますが、皆さんが分かりやすいプロジェクトを作っていただいて構いません。

好きなプロジェクトのフォルダ上で右クリック→新規作成でホバー→ロボットをクリックします。

ここでロボット名を入力します。

こちらも皆さんが分かりやすければ何でもいいですが、例えば「SUUMO情報収集」として次へをクリックします。

次にURLなどを入力する画面が出てきますので、URLはSUUMOのURL「https://suumo.jp/」を入力し、実行モードは「最小実行(ダイレクト)」を選択して終了をクリックします。

するとSUUMOへアクセス出来ます!

実行モードについて

この実行モードですが、基本的には「最小実行(ダイレクト)」だと思って大丈夫です。

その方が動きがスムーズでストレスが少ないです。

ただ、DA(Desktop Automation)という機能を使うときには「スマート再実行(フル)」でないといけないのですが、DAを使わないときは「最小実行(ダイレクト)」にしておきましょう!

ちなみに、もし間違えてしまったときには設定を変更することも出来ます。

まず、こちらの青いロボットのマークをクリックします。

するとロボットの設定というウィンドウが立ち上がりますので、「デザインモード」をクリックします。

このデザインモードの画面で、実行モードの変更が出来ます。

尚、デフォルトの実行モードを変更する場合には、下のキャプチャの「設定」をクリックします。

すると「Design Studio設定」と出てくるのでクリックします。

こちらにデフォルト実行モードという項目がありますので、こちらを最小実行にしておけばロボットを作成するときに最小実行がデフォルトになります。

次回予告

次回はSUUMOから情報収集をしていきます!

Yahooファイナンスとは異なるサイトなので、抽出の仕方も変わってきます!

お楽しみに!!

タイトルとURLをコピーしました