四直運用資料室 入鋏省略 四直運用資料室

時刻表スクレイピングツールに対する考え

web上時刻表のスクレイピングについて、2020年3月2日時点の筆者の考えをまとめる。

web時刻表とダイヤグラムの関係

家庭用コンピューターが普及する以前は、時刻表は紙媒体で、趣味用ダイヤグラムも手書きが基本であった。その後の家庭用コンピューターの普及を受けて、1990年代に登場したダイヤグラム作成ソフトがWinDIA(ふゆき氏)である。時代は下り、2005年にOudia(win向け)、2006年にCocoDia(Mac向け)が公開、更にスマートフォンの発達とともに2009年にyubiDia(iOS向け)、2016年にAodia(Android向け)、2017年にNetgram(web)が公開された。
コンピューターによる趣味用ダイヤグラム作成は、キーボードとマウスによって時刻表を入力する必要がある。ボールペンで手書きをしていた時代に比べると操作内容が増え、その入力をどれだけ簡略化できるかが課題であった。他方で、コンピューターの普及とともにインターネット上に時刻表を公開する鉄道事業者も増えていた。結果として、インターネット上の時刻表をスクレイピングし、得られたデータをダイヤグラムソフトで閲覧するための「スクレイピングツール」も同時に普及していった。
スクレイピングによってダイヤグラムを作成するツールとして、えきから to OuDia(2008年)、Getえきから2(2015年)、トレたび変換(2019年)が存在している。

スクレイピングの是非

web上を巡回して情報を取得するプログラムは「クローラー」「スクレイパー」、その行為は「クロール」「スクレイピング」と呼ばれる。クロールやスクレイピングを行うプログラムとして最も有名なのはGoogle検索である。通販サイトの価格を比較するサイトでも使われている。これらは当然合法である。(詳しくは後述)
次に、時刻表をスクレイピングする事を考える。時刻表のスクレイピングも、以下の点から合法であると考えている
  1. スクレイピングを行った場合の著作権
  2. スクレイピングを行った場合の損害
  3. 運用実績
以下、一つずつ具体的に説明する。

スクレイピングを行った場合の著作権

著作権法第三十条 著作権の目的となつている著作物(以下この款において単に「著作物」という。)は、個人的に又は家庭内その他これに準ずる限られた範囲内において使用すること(以下「私的使用」という。)を目的とするときは、次に掲げる場合を除き、その使用する者が複製することができる。(後略)
第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合
参考
スクレイピングは違法?3つの法律問題と対応策を弁護士が5分で解説
スクレイピングは違法?Webスクレイピングに関する10のよくある誤解
Webスクレイピングの法律周りの話をしよう!
スクレイピングって法律的に何がOKで何がOUTなのかを弁護士が解説。 著作物が自由に使える場合

スクレイピングを行った場合の損害

参考
Webスクレイピングする際のルールとPythonによる規約の読み込み
1秒に1リクエストするクローラーは常識的か

運用実績

おわりに

昨日、上で説明したのと同様の時刻表スクレイピングツールを公開したところ、知的財産権の侵害ではないかという質問を受けた。作者である私としては全く違法性を認識していないため、現時点での私の考えをここにまとめた。
この記事はあくまで私の認識にすぎないため、間違った記述がある可能性もある。後に違法性があることを発見した場合は、私が公開しているスクレイピングツールを公開停止するつもりである。また、違法ではないにしても、取得元から何かしらの要求があった場合は、公開停止やリクエスト間隔の変更などに対応するつもりである。