前回の記事ではループを設定して、設定したループがページを移ったとしてもちゃんと機能するかどうかを確認してみました。
そこで、きちんとループが機能することが分かりましたので、そのループの中に抽出のステップを設定していきます!
どんな情報を抽出するのか、その情報をどうしたいのか
まずはどんな情報を抽出するのか考えることが大切です。
例えばこのロボットでは、
・取得日
・物件名
・販売価格
・住所
・最寄り駅
・徒歩何分か
・土地面積
・坪単価
を抽出してみます。
また、抽出する物件の条件として
・販売価格が1200万円以下
・最寄り駅から徒歩10分以内
という条件で絞り込みをします。
このように絞り込んで抽出した情報は毎日Excelに入力し、重複した情報は追記しないように設定をしていきます。
このようにどのような情報を抽出するのか、どのような条件なのかを事前に確認をしておくことで、ロボットを作るイメージがしやすくなります。
情報を書き込むExcelを作成する
上記のように情報を収集してくることをイメージ出来たところで、書き込むためのExcelを作成します!
特に決まりはありませんが分かりやすく「SUUMO」というファイルを作ってみました。
上で、取得日~坪単価の項目を取得するようにしますので、こちらの項目をヘッダーとしてExcel内に入力をしていきます。
これでExcelの事前準備は完了です。
ExcelをDesign Studioに読み込む
以前、「Excelを開く」という記事でもお伝えしましたが、とても重要な内容なので再度詳細をお伝えします!
青枠のように最初の「Load page」のステップをクリックして、下のキャプチャの赤枠のアイコンをクリックして「アクションステップ」を選択します。
そして新しくできたステップが選択されていることを確認して、「アクションを選択」をクリック→ファイルシステムをマウスオーバー→ファイル読込をクリックします。
その後、下のキャプチャの赤枠の「ファイル名」の箇所にファイルパスを入力します。
もちろん「参照」のボタンをクリックして選択することも出来ますが、ファイルパスをそのまま入力してしまうことも多いので、そのまま入力する方法もお伝えします!
こちらのキャプチャのように読み込みたいファイルに対し、Shiftを押しながら右クリックをします。
そうすると選択肢の中に「パスのコピー」というのがあるので、「パスのコピー」をクリックします。
それをDesign Studioの「ファイル名」の部分にペーストします。
ちなみにDesign Studioではマウスの右クリックでコピーやペーストは出来ないので、「Ctrl + C」と「Ctrl + V」でコピーペーストをする必要があります。
またペーストしたら「”」(ダブルクォーテーション)が左右についているので、それを削除します。
削除しないと上手く読み込んだり、書き込んだり出来ないのでご注意ください。
Design Studio内のブラウザでExcelを開く
Design Studioの中でExcelを開く方法は色々ありますが、今からご紹介する方法が最短で簡単なので、ぜひ覚えていただきたいです!
上記のようにファイル名を入力したらファイル読込のステップの設定は完了しましたので、下のキャプチャの赤枠のステップ(ファイル読込の次のステップ)をクリックして、ファイル読込を実行します。
すると下のキャプチャの赤枠のように、右下に「アクションを選択」というボタンが出てきますので、こちらをクリックします。
そして「変数として開く」→「新しいシングルタイプの変数」→「Excel(シンプル)」をクリックします。
「新しい変数に抽出」というウィンドウが立ち上がりますので、グローバルの部分にチェックをして名前を変更します。
なんのExcel変数なのかが分かりやすかったらどのような名前でも大丈夫ですが、今回は「SUUMO抽出Excel」としておきます。
そしてOKをクリックすると、Design StudioでExcelを開くことが出来ました。
ここまでの作業を完了すると、下のキャプチャののように2つのステップが追加されています。
この「Extract Suumo抽出Excel」は、Suumo抽出Excelという名前の変数に読み込んだExcelを抽出する、というステップです。
また「Open Suumo抽出Excel」は、変数に格納したExcelをブラウザ上に開く、というステップです。
この2つのステップが自動的に作られました!
この流れでExcelを読み込むのが最短・最速なので何度も繰り返して覚えてしまいましょう!
次回予告
次回はタイプを作成して、SUUMOのサイトから情報の抽出をしていきます!
Yahooファイナンスのときには使わなかった機能も使っていきます!
お楽しみに!!