月刊ホームページ2002年10月号

数理システム科学科

数理システム解析講座

分類してみよう!

血液型や兄弟構成で性格がわかる? 血液型や生年月日で相性がわかる?

 

 いくつかの個体(物でも人でもよい)の集まりをを何らかの基準で似たもの同志は同じグループに入るように似ていないものは異なるグループに入るようにグループ分けを行うことをクラスター分析またはクラスタリングといいます。クラスター分析ではまず2つの個体間の類似度(似ている度合いを表す数値)を考えます。次に、その類似度を基にグループ分けを何らかの基準でグループ分けします。グループ分けするときの基準によってさまざまな手法が考えられています。ここではそのうちの一例を紹介します。平成13年度卒業生、鳥谷部信行さんの卒業論文より抜粋。

 

 まず、次のようなアンケートをある程度性格や相性(普段の生活で行動を共にするグループ)がわかっている知人に対して次のようなアンケートを実施しました。

 

 問1 あなたの血液型は?

 問2 あなたの兄弟構成は?

 問3 几帳面であるか?

 問4 個性的であるまたは変わっているといわれるか?

 問5 大雑把であるか?

 問6 気が強いか?

 問7 よく泣くか?

 問8 ボーっとしているといわれるか?

 問9 負けず嫌いか?

問10 飽きっぽいか?

問11 好き嫌いが激しいか?

問12 意思は強いか?

問13 自己中心的またはワガママであるといわれるか?

問14 その他にあなたが思う自分自身の性格や周りの人からいわれる性格があれば教えて下さい。

問15 あなたの生年月日は?

 

問3〜問13までは次のような五段階評価で答えてもらいました。

 

1 … まったく違う

2 … ちょっと違う

3 … どちらともいえない

4 … まあまあ合っている

5 … 非常に合っている

 

このアンケートのデータ(答え)をもとにグループ分けをして、うまくグループに分かれるか見てみよう。

 

 実際の問題では分析対象である個体のグループがよくわからないのが普通でありクラスター分析をしてグループ分けを行ってグループの特徴を読み取ります。クラスター分析は数量分類学(生物の分類を数量的に行う)や 心理学, 教育学, 考古学などの人文科学や経済学, 社会学などの社会科学やパターン認識, リモートセンシングなどの工学といったさまざまな分野で応用されています。

 

 では、本題に戻ってみましょう。 アンケートの結果をもとに次の3種類の実験(グループ分け)を行ってみよう。

 

実験1:性格の類似点から血液型のグループに分けられるか?

実験2:血液型と兄弟構成の類似点からの性格別のグループ分けができるか?

実験3:生年月日と血液型を使った占いは本当に当たっているか?

 

以下では、それぞれの実験結果を考察してみます。

 

実験1:性格の類似点から血液型のグループに分けられるか?

 アンケート結果から問1,問2,問7,問14,問15を除いた10個の質問を使ってアンケートに答えてもらった18人をグループ分けしてみよう。アンケートの回答は以下の表のようであった。

 

No

血液型

問3

問4

問5

問6

問8

問9

問10

問11

問12

問13

1

 A

2

4

3

1

5

2

5

2

1

2

2

 A

2

4

2

2

4

4

2

2

2

2

3

 A

2

4

3

2

2

4

3

1

2

2

4

 A

2

4

3

4

2

4

4

1

2

2

5

 B

3

3

3

4

2

4

4

5

3

2

6

 B

2

5

4

5

5

4

4

5

3

2

7

 B

4

5

3

4

3

4

3

5

4

5

8

 B

4

5

3

5

3

5

4

4

3

5

9

 B

4

5

2

5

3

4

3

5

3

4

10

 B

4

5

4

5

2

4

4

5

2

2

11

 O

5

5

1

2

2

2

4

4

2

1

12

 O

4

4

1

3

2

2

2

4

2

3

13

 O

5

2

4

5

2

5

4

1

5

4

14

 O

4

4

1

5

1

4

2

1

5

3

15

 O

1

5

4

4

1

5

3

4

4

1

16

 AB

4

1

2

5

4

5

4

3

3

4

17

 AB

3

4

4

5

4

2

2

2

2

4

18

 AB

3

4

1

5

5

2

4

1

3

4

 

この表のデータをもとに次の表のように各個体間の類似度を与えた。類似度の与え方はさまざまな手法が提案されている。詳しくは述べないがここではファジィ理論というものを用いてアンケートの答えによって性格が似ていれば類似度が大きく、あまり似ていなければ類似度が小さくなるように与えてあります。ファジィ理論を用いているため、ここでは類似度の値は 0 以上 1 以下の範囲で与えられています。例えば No.1 の人と No.2 の人の類似度は 0.8 となります。

 

No

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

1

1

0.8

0.8

0.8

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

2

0.8

1

0.9

0.9

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

3

0.8

0.9

1

0.9

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

4

0.8

0.9

0.9

1

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

5

0.6

0.6

0.6

0.6

1

0.8

0.8

0.8

0.8

0.9

0.7

0.7

0.7

0.7

0.6

0.6

0.6

0.6

6

0.6

0.6

0.6

0.6

0.8

1

0.8

0.8

0.8

0.8

0.7

0.7

0.7

0.7

0.6

0.6

0.6

0.6

7

0.6

0.6

0.6

0.6

0.8

0.8

1

0.9

0.9

0.8

0.7

0.7

0.7

0.7

0.6

0.6

0.6

0.6

8

0.6

0.6

0.6

0.6

0.8

0.8

0.9

1

0.9

0.8

0.7

0.7

0.7

0.7

0.6

0.6

0.6

0.6

9

0.6

0.6

0.6

0.6

0.8

0.8

0.9

0.9

1

0.8

0.7

0.7

0.7

0.7

0.6

0.6

0.6

0.6

10

0.6

0.6

0.6

0.6

0.9

0.8

0.8

0.8

0.8

1

0.7

0.7

0.7

0.7

0.6

0.6

0.6

0.6

11

0.6

0.6

0.6

0.6

0.7

0.7

0.7

0.7

0.7

0.7

1

0.8

0.7

0.7

0.6

0.6

0.6

0.6

12

0.6

0.6

0.6

0.6

0.7

0.7

0.7

0.7

0.7

0.7

0.8

1

0.7

0.7

0.6

0.6

0.6

0.6

13

0.6

0.6

0.6

0.6

0.7

0.7

0.7

0.7

0.7

0.7

0.7

0.7

1

0.7

0.6

0.6

0.6

0.6

14

0.6

0.6

0.6

0.6

0.7

0.7

0.7

0.7

0.7

0.7

0.7

0.7

0.7

1

0.6

0.6

0.6

0.6

15

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

1

0.6

0.6

0.6

16

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

1

0.7

0.7

17

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.7

1

0.8

18

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.6

0.7

0.8

1

 

次に、しきい値 t(0≦t≦1)を与えて2つの個体間の類似度が t 以上ならばその2つの個体は同じグループに入れることにします。例えば、t=0.7 としたとき No.1 の人と同じグループに入る人は No.1 の人と類似度が 0.7 以上である No.1 と No.2 と No.3 と No.4 の人になります。このように各個体と同じグループに入る人を見つけていくと18人の人のグループ分けができます。ただし、しきい値 t の値によって異なるグループ分けになることを注意しておきます。

 

アンケートの結果から

 {1,2,3,4} … A型のグループ

 {5,6,7,8,9,10} … B型のグループ

 {11,12,13,14,15} … O型のグループ

 {16,17,18} … AB型のグループ

ですが類似度をもとに上で説明したような方法でグループ分けしてみるとどうなるでしょうか?類似度を与えるときにアンケートの問1(血液型を答えてもらう質問)はあらかじめ除いているので仮に血液型はわからないということにしましょう。

 

t=0.7のときは次のようにグループ分けされます。

  {1,2,3,4} … A型だけ

  {5,6,7,8,9,10,11,12,13,14} … B型とO型

  {15}… O型だけ

  {16,17,18} … AB型だけ

 以上のとおり、血液型4つにグループ分けすることはできなかったが、A 型と AB 型ははっきりとグループ分けできた。しかし、O型とB型が一緒のグループになり、No.15 の人はどのグループにも属していない。この実験では、はっきりと血液型による4つのグループには分かれなかったが、性格の似ている似ていないによってある程度で血液型の分類ができたのではないでしょうか。

 

実験2:血液型と兄弟構成の類似点からの性格別のグループ分けができるか?

 アンケート結果の問1と問2の回答をもとにアンケートに答えてもらった 17 人をグループ分けしてみよう。アンケートの回答は以下の表のようであった。

 

No

血液型

兄弟構成

1

姉、兄、妹

2

妹二人

3

兄一人

4

兄、弟

5

姉一人

6

兄一人

7

なし

8

妹一人

9

弟二人

10

姉一人

11

妹、弟

12

なし

13

弟、妹

14

妹一人

15

兄、妹

16

AB

兄一人

17

AB

妹二人

 

この表のデータをもとに次の表のように各個体間の類似度を与えた。アンケートの答えによって血液型と兄弟構成が似ていれば類似度が大きく、あまり似ていなければ類似度が小さくなるように与えてあります。

 

No

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

1

1

0.6

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

2

0.6

1

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

3

0.4

0.4

1

0.6

0.8

0.8

0.4

0.6

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

4

0.4

0.4

0.6

1

0.6

0.6

0.4

0.6

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

5

0.4

0.4

0.8

0.6

1

0.8

0.4

0.6

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

6

0.4

0.4

0.8

0.6

0.8

1

0.4

0.6

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

7

0.4

0.4

0.4

0.4

0.4

0.4

1

0.4

0.4

0.4

0.4

0.5

0.4

0.4

0.4

0.4

0.4

8

0.4

0.4

0.6

0.6

0.6

0.6

0.4

1

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

9

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

1

0.6

0.8

0.4

0.8

0.8

0.6

0.4

0.4

10

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.6

1

0.6

0.4

0.6

0.6

0.6

0.4

0.4

11

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.8

0.6

1

0.4

0.8

0.8

0.6

0.4

0.4

12

0.4

0.4

0.4

0.4

0.4

0.4

0.5

0.4

0.4

0.4

0.4

1

0.4

0.4

0.4

0.4

0.4

13

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.8

0.6

0.8

0.4

1

0.8

0.6

0.4

0.4

14

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.8

0.6

0.8

0.4

0.8

1

0.6

0.4

0.4

15

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.6

0.6

0.6

0.4

0.6

0.6

1

0.4

0.4

16

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

1

0.4

17

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

0.4

1

 

t=0.5のときは次のようにグループ分けされます。

{1,2} … 二人は非常に似た性格を持っている。血液型はA型であり、アンケートの結果もほぼ一緒である。

{3,4,5,6,8} … B型で、性格の特徴としては個性的で飽きっぽい人が集まっている。

{7,12} … 一人っ子で、性格の特徴は負けず嫌いでワガママである。

{16} … AB型

{17} … AB型

{9,10,11,13,14,15} … O型で、性格の特徴としては変わり者でしっかりとした人たちが集まった。

 

また、3,5,6の人はB型で末っ子、そして性格の特徴は気が強く負けず嫌いな人であり、9,11,13,14の人はO型で長男または長女、性格の特徴はしっかり者である人ということがあらかじめわかっている。この実験では「一人っ子はワガママだ」とか「長男、長女はしっかりしている」など、世間一般にいわれていることがそれほど間違ってはいないことがいえたのではないだろうか。 

 

実験3:生年月日と血液型を使った占いは本当に当たっているか?

 「血液型と生年月日で相性が分かる」というのは本当なのか?血液型での相性占いと生年月日による相性占いの2つを使ってアンケートに答えてもらった 22 人をグループ分けしてみよう。次の表は血液型占いによる相性を0点から4点の5段階で評価した表である。

 

A型女性

A型男性

B型女性

B型男性

O型女性

O型男性

AB型女性

AB型男性

A型女性

2

3

1

3

4

3

2

3

A型男性

3

4

2

1

4

3

3

3

B型女性

1

2

1

3

2

4

2

1

B型男性

3

1

3

0

3

3

2

1

O型女性

4

4

2

3

3

3

1

2

O型男性

3

3

4

3

3

3

2

1

AB型女性

2

3

2

2

1

2

2

2

AB型男性

3

3

1

1

2

1

2

3

 

アンケートに答えてもらった22人に対してこの表のデータによる相性占い(血液型による相性占い)と生年月日による相性占いの結果をもとに次の表のように各個体間の類似度を与えた。占いの結果によってによって相性がよければ類似度が大きく、あまりよくなければ類似度が小さくなるように与えてあります。

 

No

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

1

1

0.5

0.5

0.4

0.5

0.4

0

0.5

0.5

0.4

0.4

0.4

0.5

0.4

0.4

0.5

0.5

0.4

0.5

0.5

0

0.4

2

0.5

1

0.7

0.4

0.5

0.4

0

0.6

0.7

0.4

0.4

0.4

0.6

0.4

0.4

0.5

0.7

0.4

0.6

0.6

0

0.4

3

0.5

0.7

1

0.4

0.5

0.4

0

0.6

0.7

0.4

0.4

0.4

0.6

0.4

0.4

0.5

0.7

0.4

0.6

0.6

0

0.4

4

0.4

0.4

0.4

1

0.4

0.6

0

0.4

0.4

0.6

0.6

0.6

0.4

0.6

0.6

0.4

0.4

0.7

0.4

0.4

0

0.6

5

0.5

0.5

0.5

0.4

1

0.4

0

0.5

0.5

0.4

0.4

0.4

0.5

0.4

0.4

0.5

0.5

0.4

0.5

0.5

0

0.4

6

0.4

0.4

0.4

0.6

0.4

1

0

0.4

0.4

0.7

0.7

0.7

0.4

0.7

0.7

0.4

0.4

0.6

0.4

0.4

0

0.6

7

0

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

0

0

0.4

0

8

0.5

0.6

0.6

0.4

0.5

0.4

0

1

0.6

0.4

0.4

0.4

0.8

0.4

0.4

0.5

0.6

0.4

0.6

0.6

0

0.4

9

0.5

0.7

0.7

0.4

0.5

0.4

0

0.6

1

0.4

0.4

0.4

0.6

0.4

0.4

0.5

0.7

0.4

0.6

0.6

0

0.4

10

0.4

0.4

0.4

0.6

0.4

0.7

0

0.4

0.4

1

0.7

0.7

0.4

0.7

0.7

0.4

0.4

0.6

0.4

0.4

0

0.6

11

0.4

0.4

0.4

0.6

0.4

0.7

0

0.4

0.4

0.7

1

0.7

0.4

0.8

0.7

0.4

0.4

0.6

0.4

0.4

0

0.6

12

0.4

0.4

0.4

0.6

0.4

0.7

0

0.4

0.4

0.7

0.7

1

0.4

0.7

0.7

0.4

0.4

0.6

0.4

0.4

0

0.6

13

0.5

0.6

0.6

0.4

0.5

0.4

0

0.8

0.6

0.4

0.4

0.4

1

0.4

0.4

0.5

0.6

0.4

0.6

0.6

0

0.4

14

0.4

0.4

0.4

0.6

0.4

0.7

0

0.4

0.4

0.7

0.8

0.7

0.4

1

0.7

0.4

0.4

0.6

0.4

0.4

0

0.6

15

0.4

0.4

0.4

0.6

0.4

0.7

0

0.4

0.4

0.7

0.7

0.7

0.4

0.7

1

0.4

0.4

0.6

0.4

0.4

0

0.6

16

0.5

0.5

0.5

0.4

0.5

0.4

0

0.5

0.5

0.4

0.4

0.4

0.5

0.4

0.4

1

0.5

0.4

0.5

0.5

0

0.4

17

0.5

0.7

0.7

0.4

0.5

0.4

0

0.6

0.7

0.4

0.4

0.4

0.6

0.4

0.4

0.5

1

0.4

0.6

0.6

0

0.4

18

0.4

0.4

0.4

0.7

0.4

0.6

0

0.4

0.4

0.6

0.6

0.6

0.4

0.6

0.6

0.4

0.4

1

0.4

0.4

0

0.6

19

0.5

0.6

0.6

0.4

0.5

0.4

0

0.6

0.6

0.4

0.4

0.4

0.6

0.4

0.4

0.5

0.6

0.4

1

0.6

0

0.4

20

0.5

0.6

0.6

0.4

0.5

0.4

0

0.6

0.6

0.4

0.4

0.4

0.6

0.4

0.4

0.5

0.6

0.4

0.6

1

0

0.4

21

0

0

0

0

0

0

0.4

0

0

0

0

0

0

0

0

0

0

0

0

0

1

0.4

22

0.4

0.4

0.4

0.6

0.4

0.6

0

0.4

0.4

0.6

0.6

0.6

0.4

0.6

0.6

0.4

0.4

0.6

0.4

0.4

0

1

 

普段の生活で一緒に行動しているグループは

{1,2,3,5,8,9,13,16,17,19,20} … グループA

{4,6,10,11,12,14,15,18,22} … グループB

{7,21} … グループC

なのですが類似度をもとに上で説明したような方法でグループ分けしてみるとどうなるでしょうか?

 

t=0.6のときは次のようにグループ分けされます。

{2,3,8,9,13,17,19,20} … グループ1

{4,6,10,11,12,14,15,18,22} … グループ2

{1}

{5}

{7}

{16}

{21}

このグループ分けを上の普段の生活で一緒に行動しているグループと比較してみるとどうでしょうか?理想的なグループ分けにある程度近いグループ分けではないだろうか。No.1 と No.5 と No.16 の人がグループ1に入っていないが、この3人は最初のうちはグループAにいたが時間がたつにつれて、それぞれ別の人たちと遊ぶようになったことを考えればむしろ当たっているのかもしれない。No.7 と No.21 も先輩と後輩という関係なだけで仲がよいというわけでもないので、この場合もあたっていると言えるのではないだろうか。この実験から占いもある程度は信憑性のあるものだといえるのではないでしょうか。

 

参考文献

クラスター分析に関しては

奥野忠一 他著, 「続多変量解析法」, 日科技連

ファジィ理論とクラスター分析に関しては

宮元定明 著, 「クラスター分析入門 ―ファジィクラスタリングの理論と応用―」, 森北出版

J. N. Mordeson and P. S. Nair, "Fuzzy Mathematics", Physica-Verlag