サイト内の現在位置

ニュース&トピックス

ボルツマンマシンによるグレースケール画像生成

DATE:2024.03.27
研究テーマ:量子コンピューティング

今回は、論文として書く程のものではありませんが、最近面白いと思った興味深い実験について共有したいと思います。機械学習や量子コンピューティング[1]に精通している方であれば、ボルツマンマシン[2]の概念は既にご存知かと思います。

ボルツマンマシンは、イジング模型に基づくエネルギー関数と分配関数を用いて確率モデルを構築します。機械学習では、制限ボルツマンマシン(RBM)、深層ボルツマンマシン(DBM)など、多様なバリエーションが開発されており、画像の生成・学習などに応用されています。ただし、イジング模型は2値ベクトルのみを扱うため、シンプルなボルツマンマシンで学習・生成可能な画像は2値化画像に限られます[3]。グレースケール画像の処理には、Gaussian-Bernoulli型のRBM[4]、MRF(Markov Random Field)[2]や、イジング模型を2値から多値に拡張したポッツ模型[5]を用いた研究が知られています。

しかし、量子アニーリングの計算を行うD-waveの実機では、イジング模型に基づくシンプルなボルツマンマシンのみが実行可能です。そこで、このシンプルなボルツマンマシンを用いて、グレースケール画像の生成が可能かどうかを検証しました。

実験では、「Standard Image Data-BAse(SIDBA)」[6]に含まれるHouse画像(図1)を使用し、以下の手順で10パターンの学習用画像セットを作成しました:

  • (1)0-25、(2)25-50、...、(9)200-225、(10)225-255の範囲でランダムに閾値を設定し、(1)~(10)のそれぞれで100枚の2値化画像を生成

これらの学習用画像セットをそれぞれ独立したボルツマンマシン(10個)で学習させ、それぞれ1000枚の画像を生成しました。最終的に、生成画像全てを平均化することで、元のグレースケール画像に近い結果(図2)を得ることができました。

図1
図2

ちなみに、

  • (1)-(10)の学習用画像セット全体の平均画像は、元のグレースケール画像に酷似していますが、(1)-(10)すべての学習用画像セットをまとめて、1つのボルツマンマシンで学習・生成させた場合、粒状の2値化画像の様なものが生成され、うまくいきませんでした。
  • (1)から(10)への画像生成の過程は、トポロジカルデータ解析(位相的データ解析)[7]のフィルトレーションの1種「sublevel filtration」[8]を用いた画像処理の時間発展に似ています。

ボルツマンマシンを用いて「画像のトポロジーの時間発展」を学習することが有効である、と言えば大袈裟かもしれませんが、今回の実験は、その可能性を示唆する様な興味深い事例でした。

担当者紹介

研究テーマ:量子コンピューティング
担当者:伊原 康行
コメント:量子コンピュータなどの研究開発を担当しています。これまで手掛けてきた主な研究領域は、画像認識、機械学習、トポロジカルデータ解析、暗号、数理科学。
連絡先:NECソリューションイノベータ株式会社 イノベーション推進本部
ipd-traffic_ai@nes.jp.nec.com