Webスクレイピング=プログラミングと考える人は多いです。

「スクレイピングするにはPythonやRubyのスキルが必要だ」と思い、それらのプログラミング言語を学ぼうとしている人は少し待ってください。

WebスクレイピングするのにPythonやRuby言語が必要だったのは「Webスクレイピングツール」が登場する以前の話です。

現在は簡単にスクレイピングすることができる「Webスクレイピングツール」が存在します。

この記事では、そんなWebスクレイピングツールの1つである「Octoparse」について詳しく解説しています。

お伝えする情報は以下です。

  • Octoparseの概要
  • Octoparseの主な特長
  • Octoparseのメリットやデメリット
  • Octoparseの口コミ
  • Octoparseのプラン内容や料金について
  • 無料版で使える範囲とはどこまでか
  • Octoparseのインストール・ダウンロード手順
  • Octoparseの使い方

Webスクレイピングツール選びに迷っている人・Octoparseに興味がある人はぜひご一読ください。


Octoparseについて

職場 在宅 パソコン


Octoparseはプログラミングに詳しくない人でも、直感的に操作ができるWebスクレイピングツールです。

この項目では、Octoparseの基本情報について解説します。


Webスクレイピングツールとは?

Webスクレイピング(Web scraping)は、Webデータ抽出・Webクローリング・Webスパイダーと同異議の言葉です。

要はWebサイトからデータを集めて抽出するソフトウェア技術を指します。

保存先はローカルデータベースやスプレッドシートなど。

Webスクレイピングをおこなうにあたり、通常はPythonなどのプログラミング言語が必要になります。

Webスクレイピングツールは、プログラミング言語の知識がない人でも手軽にスクレイピングできるよう設計されたツールのことです。


Octoparseの概要

コード記述をせずともスクレイピングをおこなえるツールです。

Webサイトからたくさんのデータ(情報)を抽出したい時に役立ちます。


対応環境

WindowsではWindows XP、7、 8、 10で動作します。

WindowsだけでなくMacOSにも対応していますので、WindowsとMacどちらのユーザーも利用が可能です。


Octoparseの特徴

screen, technology, computer


この項目ではOctoparseの特徴についてご紹介します。


簡単にスクレイピング可能

Octoparseには最先端の機械学習アルゴニズムが搭載されています。

その最先端技術を駆使し、データの正しい位置を認識し、内蔵ブラウザでWebサイトを閲覧。

クリックしたらすぐにスクレイピングが開始されます。


様々なサイトに対応している

Octoparseは静的なWebページやWebサイト。そして、AJAXやJavaScriptなどの動的Webページ・Webサイトに対応しています。

テキストやHTML、画像やURLなどのデータを抽出することが可能です。


データをクラウド上に保存できる

Octoparseが自動的に取得したデータはクラウド上に保存されます(クラウド型プラットフォームにおいて)。

そのため、いつでもどこでも取得データにアクセスできます。ハードウェアでの保守も要りません。


IPを自動的にローテーションしてくれる

クラウドを使ってデータ取得をおこなう際、対象サイトに対して同一のIPでアクセスすると、追跡されたりアクセスを拒否されたりする恐れがあります。

Octoparseのクラウドサービスのクラウドサーバーは数百台。

それぞれ独立したIPアドレスを保有しているため、自動的にIPをローテーションすることができます。


データの取得スケジュールを設定することができる

「毎日データを取得したい」「毎週データ取得をおこないたい」など自分に合ったスケジュールを設定しておけば、自動的にデータを取得することが可能です。


出力方法が豊富

取得したデータの出力方法はCSVやExcelのみではありません。

HTMLやJSON、MySQL、Oracleなどのデータベースなどの出力形式が用意されています。


Octoparseのメリット


Octoparseの特徴を掴んだところで、Octoparseのメリットについて確認しておきましょう。


簡単操作で誰でもスムーズにWebスクレイピングできる

「Octoparseの特徴」でも述べたように、Octoparseの魅力は「クリック&ドラッグで気軽におこなえるWebスクレイピング」にあります。

Octoparseには開発者でないユーザーでも使うことができるように、「XPath」や「RegEx」というツールが搭載されています。

そのツールが内蔵されているから、Webページにある色んな要素を照合することができるのです。

また、インターフェースのわかりやすさも大きなメリットといえるでしょう。


Webスクレイピングテンプレートを搭載

先にも書いたとおり、Octoparseは開発者でなくても使いやすいツールです。

Octoparseに内蔵されたWebスクレイピングテンプレートは数十種類

パラメータ(対象となるWebサイトURLや検索キーワード)の入力を完了させれば即座にデータを抽出することができます。


動的Webサイトも対応している

動的WebサイトはJavaScriptなどが使われており、静的Webサイトと比べて複雑なスクレイピングになります。

そんな動的Webサイトの情報も、Octoparseを使えば簡単に取得することが可能です。


サポートがしっかり受けられる

有料版ユーザーには電話やメール、Skypeなどでサポートがあります。

無料版ユーザーも、FacebookのOctoparseヘルプを参照したり、コミュニティを利用して問題を解決することができます。


取得ページ数の制限がない

ラップトップPCと本による電子書籍ライブラリ


無料版でも有料版でも取得ページ数の制限がありません。


日本語化している

使いやすいツールだとしても、海外のツールは日本語に対応していないことも…。

Octoparseは海外製品ですが、アプリのUIも日本語化しています。英語が苦手な人も安心です。


API申請が不要

Pythonでスクレイピングする際はAPI申請からスタートする必要があります。

しかし、OctoparseならAPI申請は不要です。


学習コストが低い

コードを書くことなくスクレイピングできるのがOctoparseの良さ。

Pythonなどのスキルを磨く必要はありません。そのため、非常に学習コストが低いといえるでしょう。


Octoparseのデメリット


この項目では、使う前に知っておきたいOctoparse​のデメリットについて解説します。


柔軟性が低い

Octoparseは初心者でも簡単に扱えるWebスクレイピングツールです。

故に、Captcha・reCaptchaといったアンチスクレイピング技術などを施されたWebサイトなどはスクレイピングすることができません。


できないスクレイピングがある

先にも述べましたが、Octoparseは柔軟性が高くはありません。

そのため、「PDFからのデータ収集」や「直接画像のDL」などは非対応です。

そうしたことがしたい場合は、Pythonを利用する必要があるでしょう。


Octoparseの評判


Octoparseを実際に利用しているユーザーは、Octoparseに対してどんな印象を持っているのでしょうか。


コーディング不要でスクレイピングができる多機能ツール

コーディングをする必要がなく、データ収集をサーバー側で実行できるようになることやCookie削除機能などについてユーザーに評価されています。


公式マニュアルの充実度がそこそこ

全てが公式マニュアルに記載されているわけではないため、使いこなすためには自分で試行錯誤する必要があるという口コミも。


インストールが簡単におこなえる

使用方法が簡単なだけでなく、導入もシンプルで簡単であることを評価する声が挙がっているようです。


有料版は少々値段が高め

良いツールではありますが、有料版の値段が少々張るのが気になるとの口コミも見受けられます。


Octoparseの料金プラン

お金


Octoparseには無料版も含めて4つの料金プランが用意されています。


フリー

無料で利用できるプランです。

まずはOctoparseを試してみたいという人向け。

使えることについては次項「無料で使える範囲」をご覧ください。


スタンダード

年間契約なら月75$月間契約なら月89$で利用できます。

個人で利用したい人はこのプランがおすすめです。

14日間の無料トライアルが用意されています。


プロフェッショナル

年間契約なら月209$月間契約なら月249$で利用できます。

少人数のプロジェクトチームや企業向けのプランです。

スタンダードプランと同じく、14日間の無料トライアルがあります。


エンタープライズ

料金については公式サイトから問い合わせましょう。

管理機能を利用したい企業向けのプランです。

企業ニーズに応じたカスタマイズをおこなえます。

30日間の無料トライアルあり。


支払い方法

  • PayPal
  • VISA
  • マスターカード
  • Discover Network
  • アメリカンエキスプレス
  • ダイナースクラブ
  • JCB

に対応しています。


料金の割引制度

教育機関やジャーナリズム、非営利団体に対しては特別割引価格で利用可能です。

割引料金を適用するには、Octoparseサポートに連絡しましょう。


返金について

全ての料金プランにおいて5日間の返金保証がついています。


無料で使える範囲

web-3963945_1920


この項目では、前項でご紹介した「フリープラン」で使える機能についてご紹介します。

取得ページ数無制限
インストール台数無制限
データエクスポート10,000レコード/回
並行ローカルタスク数* 2
作れるタスク数 * 10

引用URL:https://www.octoparse.jp/Pricing

無料プランでも取得ページ数・インストールできるパソコン台数が無制限というのは見逃せないポイント。

Webスクレイピンを始めてみようと考えている人には、十分な機能が備わっているでしょう。


Octoparseのインストール手順

Close-up of programmer's hands working on source codes over a laptop.


この項目ではOctoparseの導入方法について見てみましょう。


Octoparseのインストーラーをダウンロードする

公式サイトからOctoparseのインストーラーをダウンロードし、zipファイルを解凍しましょう。


セットアップファイルを起動する

解凍したフォルダ内にある「OctoparseSetup.msi」を起動して、指示どおりにインストールしてください。


Octoparseアカウントを登録する

Octoparseアカウントを持っていない人は新規登録します。アカウントを持っている人はログインしましょう。


Octoparseの使い方


Octoparseの公式サイトには、Octoparse初心者が段階を踏んで学べる「初心者デモ」、そしてOctoparseの使い方を記した「ヘルプセンター」が存在します。


初心者デモ

家のオフィスでパソコンを使って働く中年男性


Octoparseのトップページの「リソース」にカーソルを合わせましょう。

そこに表示される「初心者デモ」をクリックしてください。

「初心者デモ」ではOctoparseの基本操作動画とデモサイトが用意されています。

Octoparseをどうやって動かせば良いかの感覚を掴んでみましょう。

  • ECサイトの検索結果・商品詳細ページ
  • News記事の検索結果・テキストページ
  • テーブルの表組ページ

このようなスクレイピングのやり方を学べます。


ヘルプページ

抽象的な バイナリ ブルー ビジネスマン 雲 コー​​ド コー​​ディング 通信 コンピューター コンセプト 接続 サイバースペース データ デザイン デジタル エレクトロニック 指 未来的な ハッカー 手 開催 情報 インターネット 男 ネットワーク 数 数字 パターン プログラム プログラミング ソフトウェア ストリーム システム テク テクノロジー 感動 バーチャル ウェブ 白 ゼロ


「初心者デモ」と同じくトップページの「リソース」にカーソルを合わせます。

そこに表示される「ヘルプページ」をクリックしましょう。

ヘルプページには、Octoparseの使い方や活用事例、よくある質問や動画チュートリアルがあります。

「初心者デモ」を完了させた人は「はじめよう」を確認してみてください。


まとめ


以上、Octoparseについてご紹介しましたがいかがだったでしょうか。

この記事によって、気になっていた疑問・悩みを解消することができる手助けができたなら幸いです。

WebスクレイピングツールはOctoparse以外にも様々なものが存在します。

それぞれに得意なことやできないことがあるため、自分に合うのがどのWebスクレイピングツールなのかは見極めが必要です。

「これは自分の求めていたWebスクレイピングツールだ」と感じた人は、まずOctoparseの無料版を試してみることをおすすめします。