見出し画像

衛星画像から飛行機を検知してみた(1):利用したデータのご紹介

いつもクラウドクロッシングのページをご覧いただき、ありがとうございます。弊社では、衛星画像を使った新規サービスを開発中でして、画像に付加価値を付ける方法を日々、模索しています。

その中でも今回は、「AIを使った物体検知」と称して、衛星画像に写っている物をどこまでAIで検知できるのか、シリーズでお伝えしてまいります。

というのも、ユーザーは「衛星画像そのものよりも、そこに何が写っていて、何が起きているのか?を知りたいと思っている」と我々は考えており、それをAIで自動的に検出して伝えることができれば、きっと価値につながると考えるからです。例えば不法投棄を検知できれば、監視のために人を派遣しなくてもよくなります。

さて、本日はシリーズ1回目ということで、物体検知に使用したデータをご紹介します。AIを使って何か具体的な作業を行う場合、まずは「学習データ」と呼ばれる、AIを作成するためのデータを用意する必要があります。一般的にデータは量が多ければ多いほど、質が高ければ高いほど、高い精度が出ます

「質の高さ」とは、「いろいろなパターンを内包している」という意味です。例えば、今回のような飛行機を検知したい場合は、小型機、大型機、軍用機など、いろいろな形や色、エンジン数、大きさなどを含むデータでAIを作った方が、汎用性の高いAIが作れるということになります。

さぁ、まずは「データ量を確保する」という視点でデータを探索してみましょう。衛星画像はそもそも枚数が限られており、センチネルのように無償のものもありますが、大抵は有料です。しかも、センチネルは解像度が10mと少し荒く、飛行機サイズでも目視しづらくなっています。

そこで今回注目したのが「Tellus」というサイトです。Tellusは日本初の衛星データプラットフォームで、いくつかのデータセットが無料で入手可能で、解像度も2-4mと高くなっています。今回はその中でも「ASNARO-1_L1B」と言うデータを利用することにしました。

羽田空港上空の衛星画像、白っぽい色の飛行機が複数、視認できる

さて、次は「データの質を高める」ための工夫です。ここではAmazon Web Serviceが公開している「合成データ」を利用します。こちらは下図の通り、いろいろな色と大きさの飛行機が一枚の画像に収まっており、一度に複数のパターンを学習させることが可能です。

実際に利用した合成データ

今回は、AI作成のための準備として、データを集める部分のお話をしました。次回は、これらのデータを加工して、学習に必要なデータを作る「前処理」についてお話をしたいと思います。最後までご覧いただき、ありがとうございました!