グローバルナビゲーションへ

本文へ

ローカルナビゲーションへ

フッターへ


清水助教


Special Interview 1
応用数学・コンピュータ科学分野
統計学専門 清水 優祐 助教

データを解析して基準を定める面白さ

――清水先生!いきなりですが統計学ってどんな学問ですか?

清水先生

ものすごく簡単にいうと、さまざまなデータに応用数学の手法を用いてアプローチし、数値上の性質や規則性または不規則性を見いだす学問です。例えば最近、AIが何かと話題ですが、AIには機械学習と呼ばれる統計学の内容が利用されています。
――統計学の知識があれば、AIにも強くなれるんですね!そもそも清水先生が統計学を専門するきっかけは何ですか?

清水先生

学部は工学部出身ですが、就職活動の際に「アクチュアリー」という職業を知って興味を持ちました。アクチュアリーとはおもに保険の分野で、人口調査や事故率、政治や経済の動向といった統計データを収集して、保険料の算出や商品開発、資産運用を行う、いわばデータの専門家です。
そのときに「何かを解析して基準を定める」という統計学って面白いなと感じて大学院に方向転換。研究にのめりこみ、気がつけばここにいました(笑)。

【FOCUS】過去から現在、未来を扱う研究を通して社会に貢献

私の研究テーマは、時系列データを用いた数理モデルの逐次型推定です。現在は、確率微分方程式の推定に用いられる高頻度従属データの一種である株式市場のデータから、株価変動の背後にある数学的なモデルを特定する研究に取り組んでいます。さまざまなアプローチがあるなかで、私が考案しているのはオンライン型の推定手法です。従来の研究では、「最適化」を行うには過去のデータまで扱う必要があり、次第に計算負荷が高まりますが、オンライン型では過去データも考慮した“推定の方程式”をあらかじめ用意することで、新しいデータのみをリアルタイムに取り入れてどんどんアップデートすることができます。株価予測をはじめ広く適用できる理論を構築しています。

研究内容のポイント

ポイント1
秒単位で刻々と変わる時系列データのオンライン予測を研究。従来のバッチ処理では最適化の次元が増えると計算負荷がかかるが、オンライン予測では変数を用いることで負荷の低減と精度の向上が期待できる。将来の株価を予測する、新しいモジュールやツールの開発などにつながる理論を組み立てている。

ポイント2
統計学とは株価予測、気象変動、経済の動向など、あらゆる現象におけるデータを数値化する学問。数値化に用いるアプローチはひとつではなく、それぞれのデータの特性によっても適切な手法があるため、研究ではそれを開発することが醍醐味。

ポイント3
株価予測のほか、地域の人口減少、大災害への備えなど社会的な課題の解決にも応用数学は役立っている。数理モデルにより「将来はこうなる」という数値的な根拠を示すことで正しい現状認識を促し、早くから施策を講じるなど意思決定に用いられる。

学生が研究した人口データのProphet解析による精度を他のモデルを比較したグラフ。1973年から2019年の埼玉県さいたま市の人口データを学習データとして解析し、その後24か月の人口を予測して現実のデータと比較した。結果は既存のモデルより精度が向上。

膨大なテキストデータから有益な情報を取り出すテキストマイニングにも統計学や機械学習が使われている。図はデータ分析が得意なプログラミング言語・Pythonを用いて、学生が『我が輩は猫である』の冒頭の文章を解析したもの。
――いろんなデータを生成できるんですね!上の右図では、なんか「ニャーニャー」言ってますけど。

清水先生

『我が輩は猫である』の主人公だから、鳴き声もけっこうな頻度で出てきますからね。これはワードクラウドでテキストファイルを読み込んでいるのですが、例えば「人間」は「人」と「間」ではなく、人間という単語があることをはじめに機械学習しています。
学生がやったのは頻度の高い単語を大小で示すプログラミングまでですが、実は続きがあって、単語間のつながりから次に文章が作れるんです。テキストマイニングですね。だから「夏目漱石」っぽい小説を書くことも可能。個人的に興味をそそられたので、これも私の研究対象として引き続き取り組んでいきます。
――過去の作家がよみがえる。一方、人口データ分析は未来予測です。

清水先生

統計学の面白さは、過去・現在・未来という一連の流れを扱うことにあると思っています。例えば大地震が起きたときには、現象や規模などの「過去」をデータ化して数理モデルや数式をつくり、「未来」を正しく予測する。場合によってはたくさんの人の命を救うこともできる、とても重要な学問です。

【FOCUS】いま最もアツい 「Python」を使って自由に研究

数学というのはやはり難しい学問で、誰でもすぐにできるようにはなりません。なかには授業についていけずに悩む学生もいますので、一人ひとりに合った学びの方向性を提案したり、ひとつの分野を集中的に学ばせたりと、きめ細かくケアしています。楽しく学ぶのが一番ですからね。一方、統計学のセミナーでは毎年、学生たちが興味のあることを自由に研究します。最近はICT系の就職を希望する学生が多いことから、プログラミングに慣れるため、いま最もホットなプログラミング言語であるPythonを用いて、「Pythonでできること」の研究に取り組んでいます。セミナー生がそれぞれ主体的にテーマを見つけ、時にはみんなで活発に議論しています。

Pythonでできること」学生の研究例

オセロの盤面の作成
PythonからGUIを構築・操作するための標準ライブラリであるTkinterを用いてオセロの盤面と駒を作成。システムの最適化を行い、画像データと得点を関連させるとともに、最も高得点のマスには微分を用いるなど数学を使っている。

条件分岐型診断プログラム
例として「アウトドア派かインドア派か」を設定し、3つの質問にYESかNOで答えると診断結果が出るプログラムを作成。アルゴリズムにより答えた内容にしたがって質問が変化していく条件分岐型になっている。背景にある学問としては統計学を使用。

一筆書きゲーム
桜の花びらのアイコンを動かして、一筆書きで全ての通路をピンク色で塗ればクリアするというプログラムを作成。操作はキーボードの矢印キーを用いて簡便化を図った。クリア後は次のステージに自動的に進む。今回は7ステージまで設定した。

――テーマが豊富ですね!楽しく研究しながらPythonに習熟できそうです。

清水先生

毎年、学生が色んなテーマを見つけてくれるので、私も自分で研究したくなります(笑)。先に紹介したテキストマイニングもそのひとつ。また埼玉県の人口データ比較を研究した学生は機械学習も使っています。
機械学習のなかでも特にディープラーニング(深層学習)は注目されていて、城西大学ではこのほど数理・データサイエンスセンターの立ち上がるので、これをきっかけにディープラーニングにも専門的に取り組みたいとはりきっています。
――AIについては高校生も興味津々だと思います。

清水先生

高校生の体験授業では、身近なAIとして、郵便の再配達依頼などでおなじみのチャットボットを取り上げ、実際にPythonによるコードを実装してテキストファイルを作ってもらいました。プログラミングに慣れ親しむことで、応用数学にも興味が湧くと思います

【FOCUS】ゆったり、のびのび過ごせる学びの環境

――清水先生のいらっしゃる坂戸キャンパスはどんな雰囲気ですか?

清水先生

自然がすごく豊かで、ゆったりとした雰囲気なので、学生たちも伸び伸びと学べているようです。研究に集中できる環境としても最高です。
――学生さんにはどんなタイプが多いんでしょうか?

清水先生

やっぱり穏やかで真面目なタイプかな。私のセミナーではICT系の就職希望者が大半ですが、坂戸キャンパスでは独自のインターンシップ制度もあることから、教員志望の学生も多いですね。どちらかというと黙々と勉強に励む人が多いのですが、あまり自分を追い詰めずに楽しく学んでほしいので、私を含めて先生方はいつもフレンドリーに接しています。
――今年卒業された学生さんの就職状況はいかがでしょうか。

清水先生

私のセミナーでは、ほぼ全員がICT系に就職しました。ICT系と言ってもベンチャー企業が中心ではなく、銀行や証券といった金融系から、学習システムサービスなどの教育系なで幅広いです。