研究内容
人の目に映る情報は,基本的には画像であり,その情報量は時間変化まで
考慮に入れると膨大なものとなる.しかし,人はそのような画像情報に対し
選択的に視覚的注意を払う固有のメカニズムを持っており,画像内に含まれる
輪郭線などの重要と思われる特徴部分を効率的に処理している.そのため,
写真や動画などを提示する際に,素早く撮影者の意図を伝えるために,適切に
人の視覚的注意を誘導するモデルの定式化は重要な課題となる.
本研究は,視覚的重要度を定量的に表現するImportance aliency mapに基づいて
画像に異なる強さのボケを適用することで,画像や動画の視覚的注意を制御する
方法を提案する.本研究で処理された画像は,人の目がフォーカスを調整する
ときの感覚と似ているため,トレーニングされていないユーザでも,違和感なく
かつ,より効率的に視覚情報を受け入れることができると考えられる.
|
図1: Importance Mapに基づくボケを用いた人の視点誘導モデル
|
Importance mapとは,写真などの入力画像に変換を施し,視覚的重要度
が輝度値の大きさとして表現されるグレースケールの画像である.
|
|
|
|
図2: 入力画像(上)と計算されたImportance Map(下)
|
入力画像から出力されたImportance mapにおいて,高い輝度値をもつ領域,つまり重要だ
と思われる領域に,より強い視覚注意を向けさせるため,Importance mapの輝度値に応じて
ぼかしの強さが変化する Gaussian Filterを画像にかける.Eye-tracking(眼球運動追跡)
の実験結果からみると,本手法で処理された画像情報は,人はより効率的に受け入れることが
できると考えられる.
|
|
|
|
図3: 処理前後の画像に対してEye-tracking実験の結果.
|
参考文献
- Zhaolin Su and Shigeo Takahashi. Real-Time Enhancement of Image and Video Saliency using Semantic Depth of Field. In Proceedings of International Conference on Computer Vision Theory and Applications (VISAPP 2010), (to be published).
[PDF],
[Video:AVI].
|