kentaPtの日記

主に画像解析のことなどの勉強記録として投稿します。もし何かございましたら、github (https://github.com/KentaItakura)などからご連絡いただけると幸いです。

COCOデータセットのダウンロード

1. はじめに

COCOデータセットをダウンロードする際に、ダウンロードリンクから直接ダウンロードできませんでした。
この記事は、wgetを利用したダウンロード方法についての備忘録です。

cocodataset.org

なお、CocoはGoogle Cloud Platform (GCP)に格納されており、gsutil ツールを利用してダウンロードすることが推奨されています。

cloud.google.com

2. Wgetを利用したCocoデータセットのダウンロード

ここでは、Windowsを利用します。

1. Wgetをインストールする
インストール方法については、以下のページがわかりやすかったです。

www.kkaneko.jp

2. コマンドプロンプトにて以下のコマンドを実行する

なお、私は1でWgetのパスは通さず、直接

cd "C:\Program Files (x86)\GnuWin32\bin"

にてパスを移動しました。

wgetの -P オプションで保存先を指定することができます。

以下のコマンドで訓練データやアノテーションデータをダウンロードすることができます。

wget -P D:\ScanX\tools wget http://images.cocodataset.org/zips/train2017.zip

wget -P D:\ScanX\tools http://images.cocodataset.org/annotations/annotations_trainval2017.zip

ダウンロードが完了すると、指定したとおり、D:\ScanX\toolsにデータがダウンロードできました。