池原研究室 | Research

池原研究室では、画像と音声の信号処理について研究を行っています。
このページでは、主な研究テーマを紹介します。

画像処理

Image Processing

画像信号処理は池原研で主に扱っている分野です．計算環境の発展と爆発的普及により，今や画像処理技術は誰もが手軽に触れることのできる技術となり，その分野も多岐にわたります．池原研では，実時間処理が行える高速で簡便なアルゴリズムから，複雑な数理の知識を必要とする高精度な手法まで，様々なアプローチから新たなソリューションを提案しています．

デノイジング
Denoising

暗い場所で撮影した写真にはノイズ(ざらつき)が発生しやすく、画質が低下してしまいます。

理論に基づいたアプローチでそれを取り除き、きれいな画像を得ることを目指します。

超解像
Super Resolution

近年4K/8Kテレビが開発されるなど、映像デバイスの高解像度化が進んでいますが、肝心の映像データがそれに遅れを取っており、デバイスの性能が活かせていないことが課題になっています。

そこで、低解像度の画像を高解像度に拡大する方法の研究を行っています。

インペインティング
Inpainting

インペインティングは、画像の不要な人物や物体を除去する研究です。

除去した部分の背景を、周囲の情報から推定して補正します。

手ブレ除去
Deblurring

カメラの撮影の際に生じる手ブレを除去する研究です。

手ブレを、画像にあるボケ作用のフィルタを畳み込んだものとみなし、そのフィルタを推定することでブレ除去を行います。

カラリゼーション
Colorization

カラリゼーションは、モノクロ画像に自動で色をつける技術です。

人の手で一部の色を指定することで自動で他の部分を推定して彩色します。

符号化
Image Coding

ディジタル画像や動画の大容量化に伴い、低情報量で高品質な圧縮技術が求められています。

コサイン変換などの数学的テクニックを応用し、より高品質かつ効率的なデータの削減を目指します。

音声処理

Audio Processing

音声信号処理技術はスマホアプリやビデオストリーム配信などがもたらす新しい情報化社会の核となる技術で，期待の大きい分野です．その一方で画像処理に比べ，目に見えないデータを取り扱う，難しい研究分野でもあります．池原研では楽曲データから音の情報を取り出す採譜や，ボーカル抽出や話者分離といった，「機械の耳」ともいえる技術の開発を進めています．

音源分離
Audio Source Separation

複数の人間や楽器の音声が混ざっている環境下から，ある特定の人物や楽器の音のみを抽出する技術です。

複数の人数が同時に発言している音源のうちの特定の人物のみの声を抽出するなどの応用が可能です。

音高推定
Pitch Estimation

音源の音の高さを推定する技術で、音源のみからコンピュータが自動で楽譜を生成する方法について研究しています。

この技術を利用することで、楽器を演奏しながらの作曲活動などが可能になります。

機械学習
超解像

機械学習

Machine Learning

機械学習は1940年代から始まった人工知能研究の中から生まれた計算手法であり，コンピュータ自ら与えられたデータの中から特徴やパターン・法則性を見出し，現状把握や将来予測をすることなどを目的に開発されました．現在までに顔認証や文字・画像・音声認識の分野で実用化されています．当研究室では機械学習を用いた超解像技術などに取り組んでいます．