[Home]->[Project]->[Saliency Enhancement]

[English]

顕著度に基づくボケを用いた人の視点誘導モデル

研究内容

人の目に映る情報は,基本的には画像であり,その情報量は時間変化まで 考慮に入れると膨大なものとなる.しかし,人はそのような画像情報に対し 選択的に視覚的注意を払う固有のメカニズムを持っており,画像内に含まれる 輪郭線などの重要と思われる特徴部分を効率的に処理している.そのため, 写真や動画などを提示する際に,素早く撮影者の意図を伝えるために,適切に 人の視覚的注意を誘導するモデルの定式化は重要な課題となる.

本研究は,視覚的重要度を定量的に表現するImportance aliency mapに基づいて 画像に異なる強さのボケを適用することで,画像や動画の視覚的注意を制御する 方法を提案する.本研究で処理された画像は,人の目がフォーカスを調整する ときの感覚と似ているため,トレーニングされていないユーザでも,違和感なく かつ,より効率的に視覚情報を受け入れることができると考えられる.
Sample
図1: Importance Mapに基づくボケを用いた人の視点誘導モデル

Importance mapとは,写真などの入力画像に変換を施し,視覚的重要度 が輝度値の大きさとして表現されるグレースケールの画像である.
Scene 1 Importance Map 1
Scene 2 Importance Map 2
図2: 入力画像(上)と計算されたImportance Map(下)

入力画像から出力されたImportance mapにおいて,高い輝度値をもつ領域,つまり重要だ と思われる領域に,より強い視覚注意を向けさせるため,Importance mapの輝度値に応じて ぼかしの強さが変化する Gaussian Filterを画像にかける.Eye-tracking(眼球運動追跡) の実験結果からみると,本手法で処理された画像情報は,人はより効率的に受け入れることが できると考えられる.
Before After
Before After
図3: 処理前後の画像に対してEye-tracking実験の結果.


参考文献

  • Zhaolin Su and Shigeo Takahashi. Real-Time Enhancement of Image and Video Saliency using Semantic Depth of Field. In Proceedings of International Conference on Computer Vision Theory and Applications (VISAPP 2010), (to be published).   [PDF], [Video:AVI].