コンピュータビジョン / 機械学習 / 数式モデル / AI / 数学 / ディープラーニング / 画像認識 / 三次元推定 / メディア情報処理 / データ生成 /
スマホの顔認証や、撮影した画像を加工するアプリなど。普段、何気なく使っていませんか?そこに利用されている技術が、私の研究分野である「コンピュータビジョン」です。そして、コンピュータビジョンをより発展させるための「機械学習」の研究もしています。
人は目で見た情報を、脳で処理(=理解、判断)します。それと同じことをカメラとコンピュータを使って実現するのが、コンピュータビジョンです。画像は明るさが数字に対応した数字の配列からできているので、これを数学的に処理することで、画像の中にどんな物体があるかの認識や、「手前に人がいて、奥に川が流れている」といった三次元推定などの情報抽出を行うことができます。画像以外に、言語情報やセンサーが収集した距離情報などを組み合わせて処理することもあります。すると、処理しなければいけないデータ量は莫大なものになります。また、知らない物を認識できないのは人間もコンピュータも同じ。だからコンピュータに莫大なデータを学習させる、機械学習の技術が必要になるわけです。
実世界をコンピュータが情報として処理をする。またはその逆方向で、コンピュータが処理した情報を人間が目で見て分かる形にする。実世界とコンピュータの間を自由に行き来できる技術の研究を続けています。
私はずっと数学が好きで、手を動かして何かを作ることも好きでした。だから大学でコンピュータと出会った時には、数学とモノづくりが融合した世界に魅力を感じてこの道に進もうと決意しました。今でも、数学的に数字の処理を行った結果がビジュアルとして想定通りに動くとワクワクします。また近年はAIがすごいスピードで発展しているので、世の中をどんどん数式として理解できるようになり、技術の進歩の素晴らしさに感心しています。
学生たちにもこうした楽しさやワクワクを感じてほしいので、自分がやりたいと思ったことをどんどん研究するように推奨しています。アニメや音楽に興味を持ってその分野を研究する学生もいれば、ドッジボールの日本代表選手として活躍しながらゲーム中の選手やボールの動きをデータ化する研究をしている学生もいます。楽しいと思うことなら続けていけますし、どんな分野でも研究を続けていけば技術が積み重なります。そして例えば、アニメの自動着色技術の研究がCTやMRIの画像分析といった医療分野の技術に応用できる、なんていうことが実現するかもしれません。そうしたら、多くの人の健康や快適な生活に貢献できますよね。
疑問に思ったり、興味を持った対象について、調べて、解決法を試して、失敗や成功を繰り返しながら、今はまだ世の中にない何かを生み出していく。楽しいし、自分が生み出したものが社会の役に立てば嬉しい。だからこれからも「人の役に立つ技術」を目標に自分自身も研究を続けていきたいし、学生たちがそんな研究活動ができるようにサポートしていきたいと考えています。
東京大学工学部計数工学科卒業、東京大学大学院 工学系研究科 計数工学専攻 修士課程修了。NTT研究所勤務を経て、2006年、東京大学で情報理工学の博士号取得。2017年より現職。
● セマンティックセグメンテーションとその応用
● 人物動作の推定
● 画像認識モデルの軽量化