線形分離可能 ー 単純パーセプトロンの限界

単純パーセプトロンは単純な構造ですが、様々な関数を表現できます。
しかし、単純パーセプトロンの限界として、線形分離化可能な問題しか扱うことができないということがありました。

今回はこの線形分離について調べました。

 

 

 

単純パーセプトロン

パーセプトロンとは脳の神経回路を模して造られた計算モデルのことです。

単純パーセプトロンは図のように入力・重み・バイアス・出力から構成されます。

詳しくは以下の記事を参照してください。

 

 

この単純パーセプトロンは線形分離可能な問題しか取り扱うことができないという問題がありました。

それではそもそも線形分離可能とはどういうものなのでしょうか?

 

線形分離可能

線形分離のイメージ

線形分離可能なものとしてAND関数がありました。

AND関数の真理値表は次の通りです。

 

 

Table.1 AND
x1 x2 y
0 0 0
1 0 0
0 1 0
1 1 1

 

この入力を二次元平面上の点として扱うと次の図のように表現されます。

 

線形分離可能

 

 

そしてAND関数への入力の組み合わせをAND関数の出力で分けると(y=1の集合とy=0の集合に分けると)、直線一本で集合を分けることができます。

 

線形分離可能のイメージはこのようなものですが、これは非常に限られた場合のイメージです。

そこでより詳細な線形分離の定義を見ていきます。

 

線形分離可能の言葉による説明

線形分離可能の説明として次のようなものがあります。

 

二つのカテゴリーに属するパターンの集合が、ある超平面によって片方はカテゴリー1に属するパターン集合に、また超平面の反対側にはカテゴリー2に属するパターンの集合というように分離される場合には、このパターン集合は線形分離可能(linearly separable)であるという。 [1]

 

超平面とは n 次元空間内にある(n -1) 次元空間のことです。

つまり上記のAND回路の例では、二次元空間内にあるx1, x2 の組み合わせを一次元空間(直線)で分離できるので線形分離可能であるといえます。

 

hyperplane

 

 

 

線形分離可能の数式による説明

線形分離可能は数式によっても説明できます。

まず入力の集合を次の二つに分けます。

  • X+ :  出力として1を出力するもの(y = 1)の集合
  • X  :  出力として0を出力するもの(y = 0)の集合

そして次のような式を考えます。

linearly_separable_formula1

 

そしてある入力 xs に対して式Φが

linearly_separable_formula2

 

となるように式内aの集合を定めるとき線形分離可能であるといえます。

 

再びAND関数の場合で考えます。

まずX+, X はそれぞれ次のようになります。

inputs

 

そしてaの集合をそれぞれ次のように定めます。

 

as

 

これらを実際に代入して計算すると

cal

 

となり、AND関数は線形分離可能であることが確認できました。

 

まとめ

  • 単純パーセプトロンは線形分離可能な問題しか扱うことができない。
  • 線形分離可能とはある集合(n次元空間)を超平面(n-1 次元空間)で二つに分離することができることである。
  • 線形分離可能とは関数Φ(x)にたいして条件を満たすようなaの集合が存在することである。

 

参考文献

  1. 馬場則夫, 小島史男, 小澤誠一 : ニューラルネットワークの基礎と応用, p. 10, 1995, 共立出版
  2. 麻生英樹 : ニューラルネットワーク情報処理, 1989, 産業図書

 

関連記事

ニューラルネットワーク・ディープラーニングのまとめ

 

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA