第 9 回非決定性(2)、完全問題

本日の内容

9-1. 非決定性の計算のクラスの関係
9-2. P, NP
9-3. 完全問題
9-4. 宿題
9-5. 次週の予告

9-1. 非決定性の計算のクラスの関係

始めに時間限定、領域限定の言語のクラスを定義します。

Dtime(p(n))を入力の長さ n に対して決定性で p(n) 時間で受理できる言語のクラス
Ntime(p(n))は入力の長さ n に対して非決定性 p(n) 時間で受理できる言語のクラス
Dspace(p(n))は入力の長さ n に対して決定性 p(n) 領域で受理できる言語のクラス
Nspace(p(n))は入力の長さ n に対して非決定性 p(n) 領域で受理できる言語のクラス

各クラス C に対して、 co-C は言語の補集合が C に含まれるようなクラスを言います。ある言語 L が決定性のクラス C に含まれる時、 L の補集合の計算は、もともとの L の決定性の計算をし、出力する値に対して、 yes と no を入れ換えるだけで計算できます。従って、 Dtime(p(n))=co-Dtime(p(n)), Dspace(p(n))=co-Dspace(p(n)) は明らかに成り立ちます。

しかし、非決定性の場合、 accept と reject 命令を入れ換えるだけではうまくいきません。非決定性の計算では、言語 L に x が含まれるかどうかは x を accept する計算が存在するかどうかで調べます。その時、 x を accept する計算が存在しても、 x を reject する計算が存在しないことは言えません。従って、 accept と reject を入れ換えた時、次のようになってしまいます。

x が L に含まれる時: x を reject する計算が存在する。しかし accept する計算が存在しても構わない。
x が L に含まれない時: 全ての計算で x を accept する。

この場合、あらゆる入力に対して accept してしまうかも知れません。前に示した、合成数判定問題で accept と reject を交換しても素数判定ができないことを示します。合成数判定問題を解く非決定性のプログラムに対して、機械的に accept と reject を交換したものを考えます。

guess x(2≦x≦√nの切り上げ);
if( n が x で割り切れる) { reject; } else{ accept; }

この場合、自分自身と、 1 以外に自分を割り切らない数は n≧3 の時、必ず存在しますので、この非決定性のプログラムは単に n≧3 を判定するプログラムになってしまい、素数を判定することはできません。

このように、非決定性の計算では、クラス C とクラス co-C が等しいかどうかは自明ではありません。ここでは、ここに示したクラスの関係を調べます。

非決定性では、入力が一つ決まっていても、次の状態が複数あります。非決定性の Turing 機械に対して、様相を考えると、次の瞬間の様相が複数個存在します。但し、状態やテープに書き込める文字やテープヘッドの移動がそれぞれ有限の場合しかないので、 1 Step に移ることが可能な様相の数は高々定数個です。これは一般性を失わず 2 個に制限することができます。様相を考えると、非決定性の計算は初期状態を根とした木になります (但し、別々の計算から同じ様相に合流することは無視しています)。これを計算木と言います。計算木の考え方を使うと、次のことを示すことができます。

Ntime(p(N))⊆Nspace(p(N))
Ntime(p(N))⊆Dtime(2^p(N))
Nspace(p(N))⊆Dspace(p(N)²)
Nspace(p(N))=co-Nspace(p(N))

Ntime(p(N))⊆Nspace(p(N))

p(N) 時間には高々 p(N) 領域しか使えないので明らか

Ntime(p(N))⊆Dtime(2^p(N))

非決定性の Turing 機械が p(N) 時間限定である時、計算木の深さは p(N) になります。非決定性に次の状態へ移ることが可能な状態が高々 2 個とすると、木の葉の数は高々 2^p(N) になります。入力が一つ決まれば決定性の計算で計算木は一つに決定されます。そこで、決定性の計算で初期様相から木の葉を depth-first-search して、全ての木の葉をチェックすることができます。この時、depth-first-search にかかる時間は木を構成する辺の数の高々定数倍になります。従って、辺の数が 2+4+...+2^p(n) = O(2^p(N)) になるので、全ての木の葉を調べ、一つでも accept する計算が存在するかどうかを計算して yes か no を出力する計算が計算する言語は Dtime(2^p(N)) に含まれます。

Nspace(p(N))⊆Dspace(p(N)²)

領域に関する階層定理と同様に、p(N)領域限定の非決定性の機械の可能な様相の数も高々 2^p(N) になります。また、使う計算時間も高々 2^p(N) になります。ここで、問題は初期様相から受理様相まで長さ 2^p(N) 以内の計算が存在するか否かを決めることができるかです。ある様相から別の様相へ t step 以内で移れるかどうかを判定する問題を考えます。 1 step なら、様相の長さが O(p(N)) なので、実際に移れる様相を全て生成しても O(p(N)) 領域で調べることができます。いま、出発点と、終点以外に k 個の頂点情報を記憶できる領域があるとします。その時にどれくらいの距離まで調べられるか考えてみましょう。まず、 1 個だけあった時は単純に出発点と終点の中間に頂点があった時だけ、つまり距離 2 までしか考えられません。しかし、 2 個目からは状況が変わります。単純に考えると、出発点から2 頂点へだてて終点が来る、つまり距離 3 までしか調べられないような気がします。しかし、使用した領域は再利用できるため、「2 個目の頂点と出発点まで距離 2 で移れるか?」を調べたあと、「2個目の頂点と終点とが距離 2 で移れるか?」を考えることができます。すると、これで距離 4 まで調べることができます。同様に 3 個ある時は、「3 個目の頂点と出発点までが距離 4 で移れるか?」を調べることができるので、距離 8 まで調べることができます。結局、 k 個の頂点情報が記憶できる時、距離 2^k まで調べることができます。最長の計算時間が 2^p(N) なら、記憶する頂点情報は高々 p(N) 個あれば十分なので、様相の長さと必要な個数の積が求める記憶容量になります。従って、p(N)² 領域あれば、受理様相への計算が存在するかを計算することができます。

Nspace(p(N))=co-Nspace(p(N))

ここでは厳密な証明はせず、証明のアイディアを述べます。これを示すには、言語 L の補集合を受理する非決定性 p(N) 領域のTuring 機械 M をまず考えます。言語 L に属する元が入力された時は、全ての計算が reject されます。逆に L に属さない元が入力された時は、ある計算が accept されます。このような機械 M の計算木を考えます。

ここで証明のアイディアとしては、もし、 reject される様相の数があらかじめ分かっていれば、非決定性の Turing 機械で p(N) 領域でチェックできるということです。それは次のようにします。全ての様相に対して、非決定的にチェックするかしないかを決めます。チェックする時はちゃんと reject するかを確認した上でカウントします。チェックしない時はカウントしません。これを全ての様相に対して行い、カウントした数があらかじめ知っている reject される様相の数と等しければ accept します。このようにすると、入力 x が全ての様相で reject され、さらにあらかじめ与えられた様相の数が正しい時は、 accept する計算が存在します。

もう一つのアイディアは、t step で移れる様相を非決定的に数え上げられるということです。これに関する説明は省略します。

9-2. P, NP

多項式時間

問題の難しさを大雑把に評価することを考えます。具体的には「実用的な時間で求められる」「実用的な時間では求められない」など「解ける」「解けない」に直観的に近い感覚を考えます。そのためにはどんな考え方を導入すればいいでしょうか?

コンピュータプログラムで作成した関数を複数回利用することを考えます。作成した関数を c(x)、c(x) を計算する時間を t(|x|)、c(x) を計算するのに必要な領域を s(|x|) とします。また、別の関数を f(n) とします。

複数回単純に呼び出す: c(x₁), c(x₂)...
for文で f(|x|) 回呼び出す: for(i=0;i<f(|x|);i++)c(x_i)
c(x) とは別の関数 c' の出力 c'(x) に対して c を求める。: c(c'(x))

このようにすると、それぞれの計算時間は t(|x|)の定数倍、f(|x|)t(|x|)、t(t'(|x|)) となります。領域の使用量も単純計算すると同様になります。

t(n),t'(n),f(n) が多項式であるなら、このような定数倍、積、合成に閉じてますので、結果も多項式になります。また、指数関数は定数倍、積に対して閉じてます。一方、単なる c n も定数倍、合成について閉じています。複数の問題をプログラムで比較するのに、このような関数の性質があると便利です。そこで、大雑把な問題の複雑さのクラスとして、直観的な意味を含め次の概念を導入します。

リニアタイム: 入力の長さの定数倍の時間で解ける問題のクラス。入力を読む手間程度で解けるので簡単な問題
多項式時間: 入力の長さに対してある多項式で抑えられるような計算時間で計算できる問題のクラス。実用的な時間で解ける問題のクラス
指数時間: 入力の長さに対してある指数関数で抑えられるような計算時間で計算できる問題のクラス。実用的には手に負えない問題。

P,NP

今までの Turing 機械で定義した問題のクラスと、前節で議論した多項式時間などの概念を元に、厳密な(かつ大雑把な)問題のクラスを定義します。

P= ∪ Dtime(n^c)
NP= ∪ Ntime(n^c), co-NP={ L | Σ^* - L ∈ NP }
PSPACE=NPSPACE= ∪ Dspace(n^c)
EXPTIME = ∪ Dtime(2^{n^c})

これらの関係でわかっているのは次の通りです。

P ⊆ NP ⊆ PSPACE ⊆ EXPTIME
P ≠ EXPTIME

特に、 P が NP と等しいのか異なるのかは計算量理論の中で最大の未解決問題です。

9-3. 完全問題

Reducibility

問題Aの難しさを調べるのに、それを解く有効なプログラムを作ることができれば、その実行時間により難しさを調べることができます。しかし、「難しい問題」は一般には有効なプログラムが見つかってません。そのような問題の難しさを議論するにはどうすれば良いでしょうか?

もし、問題 A を解くために別の問題 B が使えたとします。例えば、偶数かどうかを判定するのに素因数分解が使えるというような関係を想定します。すると、問題 B を解くことができれば、問題 A も解決できるので、問題 A の難易度は高々問題 B 程度であることがわかります。このように問題を別の問題に変形できるかという概念を reducibilityと言います。 reducibility は推移律(A が B を利用可能で B が C を利用可能なら、A が C を利用可能)を満たすので半順序になります。従って、reducibility は通常不等号≦で表します。 reducibility のやりかたは多数あります。その中で一番重要なものは、問題 A のインスタンスを yes, no が一致するように問題 B のインスタンスへ対応づけるもので、インスタンスからインスタンスへ多対一対応(many-one)させることから、many-one reducibilityと呼ばれています。本講義ではインスタンスをその長さの多項式時間で別のインスタンスに変換する多項式時間 many-one reducibilityだけに絞って話を進めます。多項式時間 many-one reducibility は通常≦_m^p と書きます。但し、誤解を招かない限り≦のみを使うことがあります。

素朴な完全問題

半順序では、任意の二つの要素が比較可能かどうかはわかりません。そこで、どんな要素に対しても小さい要素(最小元)やどんな要素よりも大きい要素(最大元)が存在するかを調べます。

まず、最小元ですが、問題 A: 「入力が 0 なら no。それ以外は yes」のような yes, no のどちらかが有限集合になっているものが考えられます。その理由は、どんな言語 B を持ってきても、A ≦_m^p B が成り立つからです。任意の問題(言語) B を考え、x₀ が B に含まれず、 x₁ が B に含まれるとします。すると、「入力が 0 なら x₀、それ以外なら x₀」という reduction を考えると many-one reducibility になります。

一方、最大元は次のようにすれば各計算のクラスで存在することが分かります。但し、ここには示しませんでしたが、完全問題が存在しなさそうなクラスもあります。

C_P={ (i,x,c) | コードが i の決定性 Turing 機械に入力 x を与え、高々 |x|^c+c ステップ実行した時 1 を出力する }
C_NP={ (i,x,c) | コードが i の非決定性 Turing 機械に入力 x を与え、高々 |x|^c+c ステップ実行した時 accept する計算が存在する }
C_EXPTIME={ (i,x,c) | コードが i の決定性 Turing 機械に入力 x を与え、高々 2^{|x|^c+c} ステップ実行した時 1 を出力する }

例えばある問題(言語) L が NP に含まれるとします。すると、定義より L を計算する非決定性の Turing 機械が存在し、入力 x の長さに対して、その計算時間を制限する多項式 p(|x|) が存在します。これは、問題を一つ決めると Turing 機械も多項式も一つ決まります。すると、その Turing 機械のコードを i, p(n)≦ n^c+c が常に成り立つような定数を c が得られます。これにより、任意の入力 x に対して、 (i,x,c) を考えると、C_NP を利用して L を解くことができます。従って、 L ≦ C_NP が言えます。

reducibility に対して、クラス C での最大元をC 完全問題と呼びます。C_NP はNP 完全問題と言います。

9-4. 宿題

9-5. 次週の予告

次回は NP 完全問題についてお話します。

坂本直志 <[email protected]>
東京電機大学工学部情報通信工学科

第 9 回 非決定性(2)、完全問題