研究テーマ紹介&メッセージ


【2021年4月18日加筆修正】(第一版は2015年5月14日公開)
 東京高専情報工学科の学生(主に上級生≒3年生以上)を対象者として,北越が所属する知識情報研究室において,北越の指導を受けることを希望する(検討する) or ためしにどんなことをしているのか(どんな研究室なのか)覗いてみたい学生向けの資料を作成しました.

「知識情報研究室(学習組)について(第二版)」

 上記資料は,知識研(学習組)における研究活動を実施するにあたって必要な(歓迎する)知識や性格面などについて紹介しています.
内容について質問があったり,加えてほしいコンテンツ等があったら,メールで問合せや要望を送ってください.全て対応できるかは分かりませんし,対応に時間がかかる可能性が少なからずありますが,極力対応(回答)したいと思います.


 平成21年度~23年度の3年間,取り組んでいた科学研究費補助金(若手B)採択テーマ
「成績と授業評価データからなる満足度・習熟度関係性モデルを用いた学生への指導法提示」
に関する解説と現在までの成果,今後の方針について,リンク先で紹介します(研究発表一覧を更新しました : 2015年5月10日).

 このページでは私が現在、主に取り組んでいる研究テーマについて紹介します。また、ページの後半では、同様の研究に興味を持っている学生の皆さんが研究に取り組むために必要となる能力について、私なりの考えを書きました。極力難しい表現は避けて記述したつもりですが、それでもサッパリワカラン、という人は、いつでも質問に来て下さい。そんなことを言ったって、いつも部屋にいないジャン、というあなたは私宛てにメールを送ってください。なるべく早く返信しますので(結構長文ですので、休み休み見て下さい。一気に読むとどっと疲れるかも知れませんので、くれぐれも心の準備を)。

→ 今日のところは読まないでおいてトップページに戻る


テーマ紹介に入る前に・・・

 東京高専(および前所属機関以前)で過去に学生が発表した卒業論文,および特別研究論文のタイトルリストを以下のリンク先にリストアップしました。

卒業論文・特別研究論文タイトル一覧 (Updated on 2024.5.27)

研究テーマ紹介

 それでは早速、私の研究テーマについて紹介していきたいと思います。

 私が研究テーマとしているのは、人工知能(Artificial Intelligence)の中でも、機械学習(Machine Learning)と呼ばれる分野です。人工知能研究の目的は、まさに人間の知能の働きを人工的に実現することにあります。

人間の知能の働き、と一言で言っても、認知や認識、学習や適応など、様々な働きが挙げられる上、それらの働きをどのような場面へ適用するかによって、研究の対象も多岐にわたります。

 読んで字の如くではありますが、機械学習は人工知能研究の分野の中でも、「学習や適応」に関して、人間の知能の働きを機械(PCやロボット等を想像して下さいね)で実現しようとする研究分野です。

”人間の知能の働き全般”から”人間の学習や適応の仕組み”まで、若干範囲は絞り込まれたものの、機械学習研究の範囲はまだまだ広いですね。実際、学習や適応の仕組みを実現しようとする手法(アルゴリズムとも言います)はこれまた多岐にわたります。

そのような広い研究対象の中で、私が実際に取り組んでいるのは、強化学習(Reinforcement Learning)ベイジアンネット(Bayesian Network)に関する研究です。それぞれについて、以下に簡単に紹介します。

強化学習

  一言で言えば「アメとムチ」を用いた学習方式です。

人間でも動物でも、何らかの物事や行動(例えば、数学の公式を覚えるとか、犬に"お手"を教えるとか)を覚える、もしくは教える時には、最初はうまくいかなくても、うまく行ったときに褒められたり、目的の行動が出たときにご褒美をもらえれば、次第に巧くできるようになっていきます。反対に、やってはいけないことに対して叱られたり罰を与えられれば、(よほどの天の邪鬼でもない限り)そのようなことはしなくなっていきますよね?

つまり、人間やその他の動物は、誰かに褒められたり(アメ)、逆に叱られたり(ムチ)することで、特定の行動を「学習」することができるということになります。

  強化学習では、人間や動物の上のような学習の仕組みを機械に対して適用することで、機械に学習能力を持たせることを目的とします。

非常に簡単な問題から人間でも解くことが難しい複雑な問題まで、多種多様な問題に対して適用され、既に相応の成果を得ている研究分野ではありますが、まだまだ解決が困難な問題が残されている研究分野でもあります。

ベイジアンネット

 人間の学習や適応の仕組みの中では「予測」も重要な要素です。

ベイジアンネット(Bayesian Network: BN)の主な用途の一つには、物事を確率的に予測することが挙げられます。ベイジアンネットはその名の通りネットワーク構造を成しています。

一例として下の図のようなネットワークを考えましょう。これは(適当に考えた ^^;) 気象に関する事象の因果関係を表したBNです。


ノード内に記述されたラベルはそれぞれ、
P:  6時間前と比べて気圧が100hPa以上下がったか
H: 現在の湿度が70%以上か
C: 雲量は9以上か
W:1時間後の天候は雨か
R:  昨日の昼にラーメンを食べたか
を表しています。そして、それぞれのノードの間に何らかの依存関係(因果関係とも言います)がある場合、ノードの間はリンク(矢印)で接続されます。

 ここで(適当に作ったネットワークなのであまりツッコまれると困るのですが)、個々のノード間の関係を別な形式で表現すると、例えば"P"と"C"の間の関係は

「if P then C」

すなわち、

「6時間前から気圧が100hPA以上下がったなら、現在の雲量は9以上である」

という意味だと捉えられます。

まぁそういうわけで、昨日の昼にラーメンを食べようがカレーを食べようが、天気には一切関わりがない(リンクがない)ということになりますね。

ただし(ここからが重要な所なのですが)、因果関係をネットワーク構造で表したところで、一般的にこのような関係性のほとんどには「不確実性」が含まれます(世の中に、絶対的なことはそんなにないということです)。

そこでベイジアンネットでは、「if P then C」という関係性を条件付確率P(C|P)で表します。

 全てのノード、およびその間の関係が確率で表現されることによって、「気圧が下がって湿度が高い時、その後雨が降る」確率や、「現在の雲量が9以上で、昨日の昼にカレーを食べた時、その後雨が降る」確率を計算(推論)することができるようになります。

また、ベイジアンネットはその見た目自体が複数の物事の間の依存関係を表すので、関係性の良く分からない数値やデータをベイジアンネットの形で表現することで、多様な物事の間の依存関係を視覚的に分かりやすくする「データマイニング」のツールとしてもしばしば利用されます。

ベイジアンネットを利用して推論を行う場合には、その計算速度や精度が問題となり、様々な推論アルゴリズムが研究されていますが、ネットワークの構造を決定(学習)する場合も、いかに分かりやすく(矢印を必要最低限の数にして)、でも、本当に因果関係のある場所にはしっかり矢印が付くように構造を決定できるか(そしてできれば結果が早く得られるように)、が問題となります。

ベイジアンネットは、不確実性が伴う世の中の多くの現象に対して、それらの因果関係を分かりやすく見せたり、現象が起こる確率を計算したり、場合によってはその両方を実現するために利用されています。

(ひとりごと) 世の中では"ネットワーク"というと一般的にコンピュータネットワーク(インターネットとかLANとか)を想像するのでしょうね。我々研究者や理工系の学生さんであれば、ニューラルネットワークが一番有名なのかな?で、かなり好意的に見て、次がベイジアンネット? でも、最近複雑ネットワークの研究も流行ってきているからなぁ。負けないように頑張りましょう(ニューラルネットや複雑ネットについて興味のある人は、各自で調べて見てください)。

で、現在の私の研究テーマは

 強化学習の節と比較して、随分とベイジアンネットの節の分量が多いなぁ、と感じた人もいるかも知れません。
特に日本において、強化学習はベイジアンネットと比較してかなり早くから研究が進められ、実際に多くの研究成果が得られています。また、玉石混交な面も無きにしも非ずではあるものの、強化学習を検索ワードとして検索を実行すれば、かなりの数の日本語HPがHitするはずです。

 その一方で、ベイジアンネットに関する研究はその当初、こと日本において若干遅れがあったことが否定できません。

しかしながら、2000年を迎える頃からリンクのページにも記載してある通り、ベイジアンネットに関する啓蒙的なセミナーが開催されるなど、日本でも徐々にその知名度は上がり、研究に携わる人も増え、現在ではそれなりの知名度は得られているのでは、と、個人的には思っています。

 私の主な研究テーマは、上に挙げた強化学習とベイジアンネットの”両方”です。もちろん上に記述したとおり、一般的な例に漏れず、先に興味を持ったのは強化学習で、その後ベイジアンネットにも注目するようになりました。

これまで少なからぬスペースを割いて、二つの研究分野の一般的な特徴(利点)を上げてきたつもりですが、それぞれ、人間等の学習や適応の仕組みに関するある一面を模倣したものと見なせるため、個々の手法を一つ一つ見ていくと一長一短があるなぁ、というのが私の率直なイメージです。

そして、それぞれに一長一短があるのは各手法の特性であるから仕方がないものの、こいつらを巧く組み合わせてマイナス面をカバーする、あわよくば、相乗効果でもっと効率的な学習・適応の仕組みを作ることができないか、と考え始めたことが、現在の私の研究テーマのスタート地点となっています。

 私の研究テーマを平たく言えば「強化学習とベイジアンネットの短所を補い合い、長所を伸ばした”良い所取り”学習・適応システム」となります。

・・・先に謝っておきましょう。すいません。ここまで書いておきながら、私の研究テーマについての詳細は省略させていただきます m(_ _)m

 理由は一つ。ここから研究テーマの内容を書き始めたら、それこそ研究論文一本分(要約でA4サイズで10ページ前後、裏の裏まで書いたらA4で30〜40ページくらい)のスペースが必要になるからです。しかし、だから一切省略しますというのではあんまりですので、現時点での私の研究成果をお見せすることにしたいと思います。


が、ここまでずいぶんと画面も下へスクロールしてきたことですし、もったいぶる意味も込めて続きはこちらで
→ 研究テーマ紹介その2 & メッセージ
→ 疲れたので今日はここまでにしてトップページに戻る