SUUMOから情報を抽出する④ ~タイプ作成・日付取得~

SUUMOからの抽出

前回の記事では、SUUMOからどのような条件でどんな情報を抽出したいのかを考え、それに基づいてExcelを作り、Design Studioに読み込むことをしてきました。

どのような情報を抽出するのかをすでに考えてありますので、今回の記事ではタイプを作成し、日付の取得をする部分をやっていきます!

タイプを作成する

新しいタイプを作成しますので、新しいロボットを作成するときのように、SUUMO情報収集のロボットが入っているプロジェクトを選択し右クリックをします。

そして新規作成→タイプをクリックすると新しいタイプというウィンドウが立ち上がります。

分かりやすいタイプの名前で大丈夫ですが、個人的にはロボットの名前と同じ名前にするのがオススメです!

プロジェクトの中にロボットとタイプが増えてくると、どのロボットにどのタイプを使っているのか分かりづらくなってしまいますが、ロボットとタイプを同じ名前にしておけば後から見ても分かりやすいです。

このようにしてタイプの画面になりますので、Excelでヘッダーとした項目を変数として作成していきます。

short textの変数を作りたいときには「ctrl + T」を押すと、変数の種類にshort textが入った状態で名前を入力するだけで変数を作成することができるので、とてもスムーズです。

今回は全ての変数をshort textで作成していきます。

※もし後で変数の種類を変更しないといけなくなったらすみません!

注意点としては、このタイプの順番でそのままExcelに入力をするので、Excelのヘッダーの順番と同じ順番に変数を並べることが大切です。

もし順番を間違えてしまった場合には、下のキャプチャの赤枠の矢印で選択した変数の順番を変えることが出来るので大丈夫です!

このようにタイプを作成したら、ロボットに追加していきます。

変数を追加するときと同じように、変数の枠の左下の「+」をクリックします。

すると「変数を追加」というウィンドウが立ち上がりますので、タイプを選択の部分でSUUMO情報収集を選択して、OKをクリックするとロボットにタイプが反映されます。

取得日を計算する

さて次は取得日を計算していきます!

今回は「20210721」のような形を作っていきます!

以前も同じようなことをやりましたが覚えてますでしょうか?

このロボットを動かしている間、基本的に取得日は変わらないはずなので、一番最初に「変数の割当」のステップを作成します。
※下のキャプチャの青枠を確認してみてください

改めて、この変数の割当のステップの意味合いですが、「値」の箇所に入っている内容を、指定した「変数」に入れるというステップです。

そのため、今回はまず変数には「取得日」の変数を選択します。

そして、下のキャプチャの赤枠の「▼」をクリックして、コンバータを選択します。

また今回は「変数を取得」の機能は不要なので、青枠の「ー」をクリックして削除してしまいましょう。

ここから機能を追加していくので、キャプチャの「+」をクリックして、出てくるメニューの中から「エクスプレッションを評価」を選択します。

立ち上がる画面のエクスプレッションの枠に「now()」と入力していただくと、キャプチャ右下のテスト出力の箇所に今の日時が表示されます。

ちなみに、このように関数を入力をしなくても、関数を選択することでも同様の機能を使うことが可能です。

上記のキャプチャの赤枠「エクスプレッション」をクリックすると、メニューが出てくるので、そのメニューの中から「関数」をホバーすると関数の一覧が出てきます。

この一覧の中に「now()」がありますので、こちらを選択しても大丈夫です。

また、この一覧の中でよく使うのは「含む:contains(sourse,text)」や「長さ:length(…)」などです。

例えば「含む:contains(sourse,text)」の使い方ですが、部署という変数に営業部という言葉が含まれているかどうかを判定したい場合、contains(部署,営業部)と入力することで判定が可能です。

それから「長さ:length(…)」ですが、例えば変数の中の数字が何ケタかどうかを判定したい場合、length(変数)と入力します。

変数の中に入っている数字が3ケタであれば「3」、5ケタであれば「5」と出力されます。

日付の書式設定で表示形式を変更する

今回は「20210721」のような形を作っていきますので、その形を、日付の書式設定の機能を使います。

改めて「+」をクリック→「日付処理」でホバー→「日付の書式設定」をクリックします。

デフォルトで下記のフォーマットが入っていますが、フォーマットは自由に変更できますので、基本的にはこのデフォルトのフォーマットは消してしまいましょう。

そして今回の場合は年月日をそのまま表現したいので、このフォーマットの部分に「yyyyMMdd」と入力すると、テスト出力のところにイメージ通りの形式で表示することが出来ました。

次回予告

ロボット開発の序盤としては、抽出以外の部分ができましたので、次回はようやく抽出をしていきます!

お楽しみに!!

タイトルとURLをコピーしました