【Qiskit】SPSAが量子アルゴリズムに採用される理由

SPSA(Simultaneous Perturbation Stochastic Approximation)とは最適化手法の一つで、ランダムに選んだ方向の差分を取ることで、関数の勾配を近似する手法です。

\nabla f(\bm\theta) \simeq \frac{f(\bm \theta + \epsilon \bm \Delta) - f(\bm \theta - \epsilon \bm \Delta)}{2\epsilon}\bm \Delta^{-1} \\ ただし\epsilon\bm \Delta\{+1, -1\}^n

SPSAは様々な量子アルゴリズムの最適化手法に採用されていますが、この記事ではその背景となるSPSAの特徴と、Qiskitを使って実際に実装する方法を紹介します。

本記事の内容はQiskit Textbook – Quantum Machine LearningのTraining parameterized quantum circuitsを参考にしています。

SPSAの特徴
1. 計算コストが軽い
2. ノイズに対して堅牢
Qiskitによる実装
まとめ

SPSAの特徴

SPSAは以下のメリットがあることから特に量子機械学習でよく採用されている手法です。

計算コストが軽い

近似式を見ると、勾配の計算を関数値のみで表現しているため微分計算が複雑・そもそも微分不可能な関数においても利用できる点が大きな特徴です。

ただし、これはパラメータシフト法でも同様のことが言えます。SPSAが優れている点は関数の評価回数が少なく済むことにあります。

パラメータシフト法についてはこちらの記事で解説しているので併せて確認してください。

【Qiskit】パラメータシフト法を使って関数の勾配(微分)を計算する

\begin{align} \nabla f(\bm\theta) &\simeq \frac{1}{2\epsilon}\begin{pmatrix} f(\bm \theta + \epsilon \bm e_1) - f(\bm \theta - \epsilon \bm e_1) \\ \cdots \\ f(\bm \theta + \epsilon \bm e_n) - f(\bm \theta - \epsilon \bm e_n) \end{pmatrix}\\ &\simeq \frac{f(\bm \theta + \epsilon \bm \Delta) - f(\bm \theta - \epsilon \bm \Delta)}{2\epsilon}\bm \Delta^{-1} \end{align}

(1)はパラメータシフト、(2)はSPSAの評価式になります。

(1)は各パラメータの方向ごとに勾配の近似計算を行うため、パラメータの数を$n$とすると勾配を求めるために$2n$個の関数値の評価が必要となります。

一方でSPSAではランダムな方向に対する近似値計算を行うため、関数値の評価はパラメータの数によらず2回です。

実際の最適化計算ではパラメータ更新の繰り返しの回数分だけ勾配計算を行う必要があるため、大規模な系ほどSPSAの計算コストの軽さが際立つことがわかります。

ノイズに対して堅牢

SPSAの2つ目のメリットは最適化計算がノイズに対して堅牢という点です。

量子コンピュータにおける関数値の評価は量子状態の測定が必要となるためノイズが混入します。

しかし、SPSAでは関数のパラメータに予めランダムな摂動を加えて評価しているため、ノイズが混入しても摂動に埋もれてしまいノイズの影響を受けにくいと考えられています。

Qiskitによる実装

それではQiskitで実装して動作を確認しましょう。SPSAはqiskit.algorithms.optimizersのモジュールを使用します。

記事内のコードは全体の一部を抜粋しているためそのままコピーしても動作しません。
コードの全体像は私のGitHub内のJupyterNotebookをご覧ください。

実装は基本的に他のオプティマイザと同様にやることは3つです。

SPSAの実装の流れ

モジュールのインポート
コールバック処理の定義
インスタンス化
最適化処理の実行

from qiskit.algorithms.optimizers import SPSA

spsa_loss= []
xx_op_spsa= []
yy_op_spsa= []

# コールバック処理の定義
def spsa_callback(nfevs, x, fx, stepsize, accepted):
  spsa_loss.append(fx)
  xx_op_spsa.append(x[0])
  yy_op_spsa.append(x[1])

# インスタンス化
spsa = SPSA(maxiter=100,learning_rate=0.05,perturbation=0.05, callback=spsa_callback)

# 最適化処理の実行
x_opt_spsa, fx_opt_spsa, nfevs_spsa = (
  spsa.optimize(initial_point.size,
                calculate_exp_val,
                initial_point=initial_point)
)

動作を確認するために、以下の2量子ビットのパラメータ回路を用意します。