
コンピュータビジョン / 機械学習 / 数式モデル / AI / 数学 / ディープラーニング / 画像認識 / 三次元推定 / メディア情報処理 / データ生成 /
スマホの顔認証や、撮影した画像を加工するアプリなど。普段、何気なく使っていませんか?そこに利用されている技術が、私の研究分野である「コンピュータビジョン」です。そして、コンピュータビジョンをより発展させるための「機械学習」の研究もしています。
人は目で見た情報を、脳で処理(=理解、判断)します。それと同じことをカメラとコンピュータを使って実現するのが、コンピュータビジョンです。画像は明るさが数字に対応した数字の配列からできているので、これを数学的に処理することで、画像の中にどんな物体があるかの認識や、「手前に人がいて、奥に川が流れている」といった三次元推定などの情報抽出を行うことができます。画像以外に、言語情報やセンサーが収集した距離情報などを組み合わせて処理することもあります。すると、処理しなければいけないデータ量は莫大なものになります。また、知らない物を認識できないのは人間もコンピュータも同じ。だからコンピュータに莫大なデータを学習させる、機械学習の技術が必要になるわけです。
実世界をコンピュータが情報として処理をする。またはその逆方向で、コンピュータが処理した情報を人間が目で見て分かる形にする。実世界とコンピュータの間を自由に行き来できる技術の研究を続けています。

私はずっと数学が好きで、手を動かして何かを作ることも好きでした。だから大学でコンピュータと出会った時には、数学とモノづくりが融合した世界に魅力を感じてこの道に進もうと決意しました。今でも、数学的に数字の処理を行った結果がビジュアルとして想定通りに動くとワクワクします。また近年はAIがすごいスピードで発展しているので、世の中をどんどん数式として理解できるようになり、技術の進歩の素晴らしさに感心しています。
学生たちにもこうした楽しさやワクワクを感じてほしいので、自分がやりたいと思ったことをどんどん研究するように推奨しています。アニメや音楽に興味を持ってその分野を研究する学生もいれば、ドッジボールの日本代表選手として活躍しながらゲーム中の選手やボールの動きをデータ化する研究をしている学生もいます。楽しいと思うことなら続けていけますし、どんな分野でも研究を続けていけば技術が積み重なります。そして例えば、アニメの自動着色技術の研究がCTやMRIの画像分析といった医療分野の技術に応用できる、なんていうことが実現するかもしれません。そうしたら、多くの人の健康や快適な生活に貢献できますよね。
疑問に思ったり、興味を持った対象について、調べて、解決法を試して、失敗や成功を繰り返しながら、今はまだ世の中にない何かを生み出していく。楽しいし、自分が生み出したものが社会の役に立てば嬉しい。だからこれからも「人の役に立つ技術」を目標に自分自身も研究を続けていきたいし、学生たちがそんな研究活動ができるようにサポートしていきたいと考えています。



東京大学工学部計数工学科卒業、東京大学大学院 工学系研究科 計数工学専攻 修士課程修了。NTT研究所勤務を経て、2006年、東京大学で情報理工学の博士号取得。2017年より現職。
● セマンティックセグメンテーションとその応用
● 人物動作の推定
● 画像認識モデルの軽量化








初期地球の大気ー海洋ー大陸の地球システム進化 / 初期微生物生命圏の進化 / 大気中酸素濃度の変遷 / アストロバイオロジー / 火星の生命探査 / 白亜紀末の巨大天体衝突による恐竜大絶滅 / 巨大衝突クレーターの形成メカニズム / 生物大量絶滅後の海洋生態系の復活 / 深部地下生命圏の復活 / オーストラリア北西部で約35億年前の岩石を陸上掘削 / ガーナで約23億年前の岩石を陸上掘削 / ナミビアでスノーボールアース期の岩石を調査 / カンボジアの湖沼環境のヒ素汚染 / 南極に近い南大洋で研究航海 / 酸性鉱山廃水 / ワイン用ブドウ畑の土壌改良





