画像を扱う¶
目的¶
- ここでは画像ファイルを読み込む方法,表示する方法,保存する方法を学ぶ
- 次の関数の使い方を学ぶ : cv2.imread(), cv2.imshow() , cv2.imwrite()
- さらに,Matplotlibを使った画像の表示方法も学ぶ
Using OpenCV¶
画像を読み込む¶
画像ファイルを読み込むには cv2.imread(path, option) 関数を使う.これはNumpyのarrayを返す
- 第1引数 path: 画像ファイルが作業ディレクトリ内に保存されている場合はファイル名のみを指定し,そうでない場合は絶対パスか適切な相対パスで指定する.
OpenCVで扱えるファイルの拡張子(つまり、画像のコーディング方法)は次のいずれか:
jpg, jpeg, jpe, jp2, png, webp, bmp, pbm, pgm, ppm, pxm, pnm, sr, ras, tiff, tif, exr, hdr, pic, dib
- 第2引数 option は画像の読み込み方法を指定するためのフラグを指定:次のいずれか:
- cv2.IMREAD_COLOR : カラー画像として読み込む.画像の透明度は無視される. 第2引数が省略された時のデフォルト値
- cv2.IMREAD_GRAYSCALE : グレースケール画像として読み込む
- cv2.IMREAD_UNCHANGED : アルファ・チャンネル(透明度)も含めた画像として読み込む
Note
上記のフラグを使う代わりに,1, 0, -1 という整数値を与えて指定することも可能
使用例: 画像ファイルから読み込まれたデータが変数imgの値として記憶される (messi5.jpgを使用している)
import numpy as np import cv2 # Load an color image in grayscale img = cv2.imread('messi5.jpg',0)
Warning
画像のファイルのパスが間違っていてもエラーとならない!そこで、
print(img)
を実行するとNone
と表示される (よくありがちなバグなので注意しよう)
画像を表示する¶
画像をウィンドウ上に表示するには cv2.imshow(window_name, img) という関数を使う.自動で画像サイズに合わせて window_name という名前のウィンドゥに画像が表示される。 ただし実際にはこれだけでは表示されないので実行例を見よ.
- 第1引数 window_name にはウィンドゥの名称を文字列型で指定する. いくつでも作れるが、別々の名前にすること。 また、日本語を指定すると文字化けすることが多いので、 半角英数字からなる名前にすること。
- 第2引数 img は、window_nameで指定したウィンドゥに表示する画像データ
cv2.waitKey
関数を実行しない限り、画像が表示されないことに注意 (コード、messi5.jpg)
cv2.imshow('image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
上記のコードを(Fedora-Gnome machineで)実行した結果のスクリーンショットは以下のようになる.:
cv2.waitKey(n) は、キーボード入力をn ms(ミリ秒)待ち、 その間にキーが入力されれば次の処理を行う関数.nの値として 0 を指定した時は,キー入力を無期限で待ち続ける. 以下で説明するように,特定のキー入力のみを待つ(例えば aの入力だけを受け付ける)ようにすることも可能
cv2.destroyAllWindows() は現在までに作られた全ての ウィンドウを閉じる関数.特定のウィンドウだけを閉じたい場合は、 window_nameにそのウィンドゥの名前を与えて、 cv2.destroyWindow(window_name) 関数を実行する.
Note
あらかじめウィンドウを作成しておき、後から読み込んだ画像を表示させたい場合cv2.namedWindow(window_name, flag) を用いる。
この第1引数 window_nameはウィンドゥの名前であり、
第2引数flagにはデフォルト値として cv2.WINDOW_AUTOSIZE
が指定されている.
これは画像のサイズに合わせてウィンドゥのサイズが自動変更されるというフラグである。
またflagに cv2.WINDOW_NORMAL
を指定すると,ユーザーがサイズを変更できるウィンドウが作成される。
この機能は,画像のサイズが非常に大きい時やウィンドウにトラックバーを追加する時などに便利.
実行例:
cv2.namedWindow('image', cv2.WINDOW_NORMAL)
cv2.imshow('image',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
画像をファイルに保存する¶
画像をファイルに保存するには cv2.imwrite(path, img) 関数を使う.
- 第1引数pathには画像のファイル名へのパス. cv2.imread()
関数と同じく、ファイル名の拡張子によってコーデック(画像保存方式)が選ばれる。
以下の拡張子が使える:
jpg, jpeg, jpe, jp2, png, webp, bmp, pbm, pgm, ppm, pxm, pnm, sr, ras, tiff, tif, exr, hdr, pic, dib
- 第2引数imgには保存したい画像データを指定する
cv2.imwrite('messigray.png',img)
まとめる¶
以下が画像ファイルmessi5.jpgから画像をグレースケール(白黒)画像として読み込み,imageという名前のウィンドウに表示した後, ‘s’ というキーを押せば画像をmessigray.pngファイルに保存し、ESC を押せば画像を保存せずに終了するプログラム: (コード, messi5.jpg. 注意: Ubuntuの下でのAnaconda Python3.5では
import numpy as np
import cv2
img = cv2.imread('messi5.jpg',0)
cv2.imshow('image',img)
k = cv2.waitKey(0)
if k == 27: # wait for ESC key to exit
cv2.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
cv2.imwrite('messigray.png',img)
cv2.destroyAllWindows()
Warning
64 bit マシンを使っている場合, k = cv2.waitKey(0)
の部分を k = cv2.waitKey(0) & 0xFF
と変更してください.
Matplotlibを使った画像の表示¶
MatplotlibはPythonのデータの可視化用ライブラリで,様々なデータの可視化方法を提供している.ここでは,Matplotlibを使った画像の表示方法を学ぶ.Matplotlibを使えば,画像のズームや保存ができる : (コード)
import numpy as np
import cv2
from matplotlib import pyplot as plt
img = cv2.imread('messi5.jpg',0)
plt.imshow(img, cmap = 'gray', interpolation = 'bicubic')
plt.xticks([]), plt.yticks([]) # to hide tick values on X and Y axis
plt.show()
上のプログラムを実行したときのウィンドウのスクリーンショットは以下
See also
Matplotlibを使えば,多くのオプションが指定できる.詳細については Matplotlib のドキュメントを参照すること.ただし、機能のいくつかはこのチュートリアルで扱う.
Warning
OpenCVで読み込んだカラー画像はBGR(青-緑-赤)モードで読み込まれる.しかし, Matplotlib は画像をRGB(赤-緑-青)モードで表示する.そのため,OpenCVを使って読み込んだ画像を表示しようとすると,色成分がおかしな表示になる.詳細については以下のexercisesを参照すること.
課題¶
- OpenCVで読み込んだカラー画像をMatplotLibを使って表示すると変な表示になってしまう.このディスカッション を読み,その理由を考えよ.
また、OpenCVで読み込んだカラー画像をMatplotLibを使って正常に表示する方法を答えよ。