専任教員

企業のエンジニアからリサーチャーを目指すことは私にとって高い壁でした。みなさんも目の前の壁に挑戦していきましょう。

市川 治

データサイエンス学部 教授
研究分野:音声データ処理・テキストデータ処理

コミュニケーションロボットの「Pepper」やスマートスピーカーの「Amazon Echo」「Google Home」、パーソナルアシスタントの「Siri」などのAIが用いられたデバイスが普及してきている現代において、AIと人間を繋ぐ一番の媒体は「音声」であり、その媒介を可能とする音声認識システムが注目を集めています。いわばAIと人間の通訳ともいえるこの行為には音声をどのように正しく認識するか、音声データをどのように扱うのか、などの音声データ処理技術が必要不可欠です。このような技術の研究内容や、他の分野においてどのように役立つのか、また、市川教授の研究者になるまでの道のりも含め赤裸々に語っていただきました。

聞き手 データサイエンス学部1期生/3年(当時) 江口 公基
※本記事は、滋賀大学データサイエンス・AIイノベーション研究推進センターのセンター誌『Data Science View Vol.3』の特集企画『私の「研究」履歴書』に掲載された記事の内容に若干の修正を加えたものです。本文中に記載されている内容や所属・肩書き等はすべて取材当時のものです。

音声×教育?

Q.先生の研究分野は「音声データ処理」とのことですが、どのようなことをしているのでしょうか。

大学に来るまでは企業にいたのですが、そこでは主に、音声認識に必要なニューラルネットワークを改善する研究をしていました。今は教育に関する音声データ処理もやっています。東京大学のCoREFの先生と一緒に、グループワーク中の中高生にマイクをつけてもらって、学びの過程を音声認識の技術で可視化する研究をやっています。ただグループワークでは、複数の生徒の声が同時に入ってくることで音声データが複雑になるので、その信号処理にも取り組んでいます。さらに、滋賀大学教育学部と共同で、生徒と先生の発話から授業がどれくらい活性しているかを可視化する研究も行っています。以前は音声認識そのものの改善が会社への貢献になるので、基礎の部分をかなりの時間を割いてやってきましたが、滋賀大学に来てからは応用にフォーカスが当たってきているような気がしますね。

エンジニアとリサーチャーの壁

Q.市川先生はなぜ研究者になったのですか?

そこに市川の人生があるんですよ! 中学生の頃からコンピュータやものづくりに興味があって。大学に入ったあとも、航空工学を学びながらもその興味は衰えず、IBMにエンジニアとして入りました。でもこのままじゃだめだと数年で思って…というのも、大きな企業のエンジニアはものをつくるといっても自分のアイデアを活かせない。それがフラストレーションで。そこで研究職になろうと考えるようになって。ただ、エンジニアとリサーチャーの壁がものすごく高いんですよ。ゼロからものを起こすのはものすごーく大変だった。けれども何のバックグラウンドもないのに自分を売り込んで料理研究家になった妻を見て、なんでも挑戦すればドアが開かれることを学びました。
そこで自分もまずは動こうと、社内の論文大会に参加して五年連続で賞をもらったり、特許をとったり、週に一度大学に通って学術論文を書いたりして、やっと会社の基礎研究所に異動できました。そのあとは思い通りの研究活動ができたと思います。
ずっとそこにいることもできたのですが、教育にもすごく興味があったので、教える仕事をすることを次の目標にしたのです。自分の子どもからも、教えるのがうまいと言われてそそのかされました(笑)。会社で学んだこともフィードバックしたかったし、大学にくれば好きな研究ができる。それで滋賀大学に応募したら、偶然受かったわけです(笑)。

―確かに先生の講義はわかりやすいと学生の間でも評判です(笑)。

ほんとに? うれしいなぁ! そう言ってもらわないと自分で言うだけじゃちょっとね(笑)。そういう言葉を聞くだけでも励みになります。

パニックモードになるな

Q.これからデータサイエンティストになる方々に一言メッセージをお願いします。

常にストレスを減らすような暮らしをして、アイデアが湧くようなマインドを持ってほしいです。「パニックモードになるな」っていう言葉があって。パニックモードっていうのは例えば、テニスをやっていて、相手に振り回されてボールを追っているだけになってしまって何の戦略も考えられない状態のことを言うんだけど、状況をコントロールできる状態に自分自身をもっていくことが大事。状況をコントロールできるようにして、自由なアイデアが湧くような人間になってほしいなと思っています。

教員紹介はこちら