【2018年11月】今Webブラウザ操作を自動化するならPuppeteerが圧倒的にオススメ!

【2018年11月】今Webブラウザ操作を自動化するならPuppeteerが圧倒的にオススメ! 技術的なこと
この記事は約5分で読めます。

ブラウザの自動操作で仕事を楽にしたくない?

RPA(ロボティック・プロセス・オートメーション)なんていう言葉が

働き方改革の流れで飛び出してきましたよね。

ロボットによる業務自動化のことです。

 

ロボットが自動で業務と聞くと、

トヨタ自動車の工場でロボットアームが

溶接作業とかを自動で行っているようすを思い出します。

 

でも、そんなに大げさなものばかりでもないんです。

日々のデスクワーク、特にパソコン処理は自動化できる余地が大きいです。

毎月行う定型処理をエクセルでマクロ化するのも立派な自動化です。

 

めんどくさがりな私は、ずっと前から自動化には興味津々です。

特にインターネットから情報を拾ってきたり、

自動で書き込みをしたりといった自動化は長いことやってきました。

 

Webスクレイピングとか呼ばれるものですね。

最近革新的なWeb操作自動化の仕組みが出てきたので紹介します。

それが、Puppeteer(パペティア)です。

 

 

Web操作自動化の壁

Web操作の自動化といっても方法は色々あります。

Linuxシェルのwgetコマンド
PerlのWWW::Mechanize
PythonのBeautifulSoup
RubyのNokogiri
FirefoxアドオンのiMacros
Windows自動化ツールのUWSC

など、一通り使ってきました。

 

レガシーというか素朴なHTMLで構成されているページであれば

上記の方法で問題なく欲しい情報を拾い集めたり、

操作を自動化することができます。

 

しかし、最近のサイトだとうまくいかないことがあります。

Javascriptによる非同期な画面描画を取り入れているページ

があるからです。

 

次のページを読み込もうとしているのに、

対象のページはまだ描画が終わっていなくてエラーになっちゃう、

みたいなことが起こってしまいます。

 

そこを乗り越えるために必要になってくるためのスタンダードが

Selenium(セレニウム)というツールです。

 

 

Seleniumは便利だけど設定がシンドイ

Selenium(セレニウム)という元素か鉱物みたいな名前のツールですが、

元々はWebアプリケーションのUIテスト用に作られました。

「いろんなブラウザで操作の検証をしたいけど、手作業でやるのマジだるいよね」

という思いから出来上がったと思われます。

 

それだけに、ブラウザのドライバーを変えることで

ChromeもFirefoxもMicrosoft Edgeも自動化することができます。

 

何でもできる、それは裏を返せば設定がメンドクサイと言えます。

 

Javaの環境設定とかへっちゃらにこなせる方であれば

使いこなせると思います。

 

PythonであればJavaよりは簡単に設定できます。

ネットで調べれば情報はいくらでも集まりますからね。

 

とはいえ、調べるのは大変ですし、

手順が一から本になってた方が楽ですよね。

Javascriptによる非同期処理にも対応できて、

比較的かんたんに環境設定できて、

導入方法が一冊の本にまとまっているツールないかなぁ・・・

そんな都合のいいツールが・・・

 

 

 

 

 

 

ありますよ!

 

それがPuppeteer(パペティア)です!

 

 

 

なぜPuppeteer(パペティア)がいいのか?

Puppeteer(パペティア)をオススメしたい一番の理由は、

Googleが作っているツールということです。

 

Chromeブラウザを作ってるグーグルが作る自動化ツールですから

ブラウザのアップデートにもしっかり対応していくことが期待できます。

 

ヘッドレスモードといって、ブラウザを画面に表示せずに

裏でブラウザを開いているかのようにWeb操作を自動化するモードがあります。

 

そのヘッドレスモードを実現するための有名なツールに

PhantomJS(ファントムジェーエス)という中二病心をくすぐるネーミングのものがありました。

そのPhantomJS(ファントムジェーエス)が開発を終了したのは、

同等以上の機能を持つPuppeteer(パペティア)が登場したということも

大きな要因になってるのではないかと思います。

 

 

 

一般のWindowsユーザーでも手順通りやればWeb操作自動化ができるようになれる本

Puppeteer入門 スクレイピング+Web操作自動処理プログラミング

 

>>Puppeteer入門 スクレイピング+Web操作自動処理プログラミング

 

 

単行本: 384ページ
出版社: 秀和システム (2018/9/19)
言語: 日本語
ISBN-10: 4798055204
ISBN-13: 978-4798055206
発売日: 2018/9/19

 

この本は、Webスクレイピングでできること、やってはいけないことなどの説明

Windowsユーザーが環境設定をするための手順、

スクレイピングのためのJavascriptの基礎、

豊富なWeb自動操作のサンプル掲載、

などなど程よい深さで広くカバーされています。

 

Webブラウザ操作の自動化にチャレンジしてみたいという方に

オススメの一冊です。

 

 

私がこの本を見ながらPuppeteer(パペティア)を使ってみた印象は、

・気軽に導入できる(node.js初めて触りました)
・Selenium(セレニウム)よりもとっつきやすい印象
・ブラウザ起動も軽快で気持ちいい

といったものでした。

 

 

気になる方はチェックしてみてください。

コメント

タイトルとURLをコピーしました