池原研究室では、画像と音声の信号処理について研究を行っています。
このページでは、主な研究テーマを紹介します。
画像処理
画像信号処理は池原研で主に扱っている分野です.計算環境の発展と爆発的普及により,今や画像処理技術は誰もが手軽に触れることのできる技術となり,その分野も多岐にわたります.池原研では,実時間処理が行える高速で簡便なアルゴリズムから,複雑な数理の知識を必要とする高精度な手法まで,様々なアプローチから新たなソリューションを提案しています.
デノイジングDenoising
暗い場所で撮影した写真にはノイズ(ざらつき)が発生しやすく、画質が低下してしまいます。
理論に基づいたアプローチでそれを取り除き、きれいな画像を得ることを目指します。
超解像Super Resolution
近年4K/8Kテレビが開発されるなど、映像デバイスの高解像度化が進んでいますが、 肝心の映像データがそれに遅れを取っており、デバイスの性能が活かせていないことが課題になっています。
そこで、低解像度の画像を高解像度に拡大する方法の研究を行っています。
インペインティングInpainting
インペインティングは、画像の不要な人物や物体を除去する研究です。
除去した部分の背景を、周囲の情報から推定して補正します。
手ブレ除去Deblurring
カメラの撮影の際に生じる手ブレを除去する研究です。
手ブレを、画像にあるボケ作用のフィルタを畳み込んだものとみなし、そのフィルタを推定することでブレ除去を行います。
カラリゼーションColorization
カラリゼーションは、モノクロ画像に自動で色をつける技術です。
人の手で一部の色を指定することで自動で他の部分を推定して彩色します。
符号化Image Coding
ディジタル画像や動画の大容量化に伴い、低情報量で高品質な圧縮技術が求められています。
コサイン変換などの数学的テクニックを応用し、より高品質かつ効率的なデータの削減を目指します。
音声処理
音声信号処理技術はスマホアプリやビデオストリーム配信などがもたらす新しい情報化社会の核となる技術で,期待の大きい分野です.その一方で画像処理に比べ,目に見えないデータを取り扱う,難しい研究分野でもあります.池原研では楽曲データから音の情報を取り出す採譜や,ボーカル抽出や話者分離といった,「機械の耳」ともいえる技術の開発を進めています.
音源分離Audio Source Separation
複数の人間や楽器の音声が混ざっている環境下から,ある特定の人物や楽器の音のみを抽出する技術です。
複数の人数が同時に発言している音源のうちの特定の人物のみの声を抽出するなどの応用が可能です。
音高推定Pitch Estimation
音源の音の高さを推定する技術で、音源のみからコンピュータが自動で楽譜を生成する方法について研究しています。
この技術を利用することで、楽器を演奏しながらの作曲活動などが可能になります。
機械学習
機械学習は1940年代から始まった人工知能研究の中から生まれた計算手法であり,コンピュータ自ら与えられたデータの中から特徴やパターン・法則性を見出し,現状把握や将来予測をすることなどを目的に開発されました.現在までに顔認証や文字・画像・音声認識の分野で実用化されています.当研究室では機械学習を用いた超解像技術などに取り組んでいます.
超解像Super Resolution
画像を拡大した際に生まれるボケを鮮明に映す技術です。
画像を小さなパッチに分け,類似性の高いものを集めて処理する事で効率的で精度の高い超解像を実現しています.
深層学習
機械学習の一種である深層学習は,現在池原研究室で最も盛んに研究が行われている分野です.人間の神経回路モデルを模した多層構造の「ディープニューラルネットワーク」を用いて,画像や音声の特徴を機械に学習させる手法です.2012年に開催されたILSVRC(大規模画像認識の競技会)で深層学習による手法が圧倒的な成績を残して以来,多分野で注目されています.当研究室には深層学習のために十分なサーバ環境が用意されおり,画像ノイズ除去や音源分離などに取り組んでいます.
雨すじ除去Single-image Rain Removal
雨天時に撮影した画像から雨すじを取り除く技術です.
畳み込みニューラルネットを用いて,一枚の画像から雨検出と雨ノイズ除去の両方を同時に行います.車載カメラや監視カメラに応用可能です.
ノイズ除去Noise Removal
暗い場所などで写真を撮影した際に現れるノイズ(ざらつき)を除去する技術です.
畳み込みニューラルネットを用いる事で,従来の手法よりも高品質な画像を得る事が出来ます.
カラリゼーションColorization
白黒画像を着色しカラー画像を生み出す技術です.
畳み込みニューラルネットを用いて,人間によるヒントなしに全自動で色付けする手法が開発されています.
映り込み除去Reflection Removal
ガラス越しに写真を撮った際の映り込みを除去する技術です.
敵対的生成ネットワークを用いて,映り込みを認識・除去する技術を開発しています.
音源分離Audio Source Separation
複数の人間や楽器の音声が混ざっている環境下から,ある特定の人物や楽器の音のみを抽出する技術です.
複数の人数が同時に発言している音源のうちの特定の人物のみの声を抽出するなどの応用が可能です.
研究方法Research Environment
本研究室では、PythonやMATLAB®を用いて実装・実験を行っています。
慶應義塾大学では、学生全員に無料でMATLAB®のライセンスが配布されているため、自分のパソコンにインストールして、 自宅や移動中でも研究を行うことが可能です。
また学生にはMacが貸与され、池原研究室が所有する8台のGPUサーバーは深層学習に利用されています。