MMPretrain のインストールと,それを用いた画像分類の実行についての手順を説明する.MMPretrain は OpenMMLab の一部で,画像分類のためのツールボックスとベンチマーク機能を提供している.このページでは,Windows 上でのインストール方法とビルド方法,エラーメッセージの確認,および ImageNet-1k データセットで訓練された ResNet50 モデルを用いた画像分類の実行手順を説明する.関連する外部ページへのリンク,公式ドキュメント,学習済みモデルへのアクセス方法も示す.
【目次】
MMPretrain (MMClassification) は, OpenMMLab の構成物で, 画像分類のツールボックスとベンチマークの機能を提供する.
【文献】
MMClassification Contributors, OpenMMLab's Image Classification Toolbox and Benchmark, https://github.com/open-mmlab/mmclassification, 2020.
【関連する外部ページ】
Gitは,バージョン管理システム.ソースコードの管理や複数人での共同に役立つ.
【サイト内の関連ページ】
Windows での Git のインストール: 別ページ »で説明している.
【関連する外部ページ】
Git の公式ページ: https://git-scm.com/
【サイト内の関連ページ】
【関連する外部ページ】
Python の公式ページ: https://www.python.org/
【サイト内の関連ページ】
NVIDIA グラフィックスボードを搭載しているパソコンの場合には, NVIDIA ドライバ, NVIDIA CUDA ツールキット, NVIDIA cuDNN のインストールを行う.
【関連する外部ページ】
コマンドプロンプトを管理者として実行: 別ページ »で説明
PyTorch のページ: https://pytorch.org/index.html
次のコマンドを実行することにより, PyTorch 2.3 (NVIDIA CUDA 11.8 用)がインストールされる. 但し,Anaconda3を使いたい場合には別手順になる.
事前に NVIDIA CUDA のバージョンを確認しておくこと(ここでは,NVIDIA CUDA ツールキット 11.8 が前もってインストール済みであるとする).
PyTorch で,GPU が動作している場合には,「torch.cuda.is_available()」により,True が表示される.
python -m pip install -U --ignore-installed pip python -m pip uninstall -y torch torchvision torchaudio python -m pip install -U torch torchvision torchaudio numpy --index-url https://download.pytorch.org/whl/cu118 python -c "import torch; print(torch.__version__, torch.cuda.is_available())"
Anaconda3を使いたい場合には, Anaconda プロンプト (Anaconda Prompt) を管理者として実行し, 次のコマンドを実行する. (PyTorch と NVIDIA CUDA との連携がうまくいかない可能性があるため,Anaconda3を使わないことも検討して欲しい).
conda install -y pytorch torchvision torchaudio pytorch-cuda=11.8 cudnn -c pytorch -c nvidia py -c "import torch; print(torch.__version__, torch.cuda.is_available())"
【サイト内の関連ページ】
【関連する外部ページ】
インストールの方法は複数ある. ここでは, NVIDIA CUDA ツールキットを使うことも考え, インストールしやすい方法として,ソースコードからビルドしてインストールする方法を案内している.
コマンドプロンプトを管理者として実行: 別ページ »で説明
python -m pip install -U --ignore-installed pip python -m pip uninstall -y openmim mmcv mmcv-full opencv-python opencv-python-headless python -m pip install -U openmim opencv-python cd %HOMEPATH% rmdir /s /q mmpretrain git clone https://github.com/open-mmlab/mmpretrain.git cd mmpretrain pip install -r requirements.txt mim uninstall -y mmpretrain mim install mmpretrain python -c "import mmpretrain; print(mmpretrain.__version__)" mim list
エラーメッセージが出ていないこと.
事前学習済みモデル
Mmpretrain の model zoo のページ: https://github.com/open-mmlab/mmpretrain/blob/master/docs/en/model_zoo.md
ここではResNet50 を選ぶことにする. ImageNet-1k データセットで学習済みのモデルである.
コマンドプロンプトを管理者として実行: 別ページ »で説明
Python プログラムは,公式ページ https://mmpretrain.readthedocs.io/en/latest/user_guides/inference.html のものを書き換えて使用.
import os import torch import mmpretrain import mmcv os.chdir((os.getenv('HOMEPATH') + '\\' + 'mmpretrain')) device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') model = mmpretrain.get_model('configs/resnet/resnet50_8xb32_in1k.py', pretrained=True, device=device) img = 'demo/demo.JPEG' # or img = mmcv.imread(img), which will only load it once result = mmpretrain.inference_model(model, img) print(result)