マイクロソフトの社内インキュベータープログラム「Microsoft Garage」が、会議の内容を文字起こしできる新たなプロジェクト「Group Transcribe」を発表した。会議参加者それぞれのデバイスで会議の内容を記録することで、各人の音声をデバイスのマイクが認識。今まで以上に精度の高い文字起こしが実現可能になるという。コロナ禍におけるリモートワーク拡大から、音声認識技術は向上し続けている。こうした議事録アプリの需要は、サラリーマンを中心にさらに増加していくことになるのではないだろうか。
80以上の言語での翻訳機能も追加に
アプリの使用には、会議参加者がそれぞれに自分のデバイスでアプリを立ち上げる必要がある。参加者の音声を、各デバイスで拾い上げるためだ。その後会議がスタートすると、リアルタイムで文字起こしがスタート。アプリに搭載されたAIの音声言語技術向上から、より高精度に音声を聴き分けられるようになった。
これまでは大勢のメンバーが参加する会議では、マイクから遠いことで声が聴きとれなかったり、話者の区別が困難だったりとあらゆる障壁があった。そんな中で、このGroup Transcribeは、一人ひとりの音声を容易に区別できるようになり、音源を聴きなおす必要もなくなり作業効率も上がりそうだ。さらに、ゆくゆくは80を超える言語の翻訳機能も搭載される予定だという。リアルタイムで内容を翻訳してもらえるため、会議の直後に即座に議事録を送ったりすることもでき多くの会議に追われているサラリーマンの支持を集めることとなってもおかしくはないだろう。
アプリの利用方法には会議参加者全員の協力が必要だ。会議参加者がGroup Transcribeを起動して会議を開始。その後BluetoothでQRコードをスキャンし、会議参加者同士でリンクを共有。デバイスを通して、各人が会議の文字起こしを見ることができる。さらに出席者の声量レベルを比較して、デバイスに近い話者をアプリが認識。誰が話したのかをクラウドサービスが判断してくれるため、話者のラベル付けも容易になるだろう。
同アプリは現在、iOSのみで利用可能。iPhoneユーザーが多いアメリカや日本ではアプリの普及も早そうだ。また、世界的に見ればAndroidスマホのユーザーが多数派となっているため、Androidスマホの対応がリリースされれば、利用者数拡大が見込めそうだ。
Group Transcribeのほかにも、さまざまな種類の議事録アプリが公開されている。個人向け自動文字起こし「Texter」や「Speechy Lite」「Otter.ai」、企業や自治体で使われる「スマート書記」である。コロナ禍におけるリモートワークの拡大で、議事録アプリの幅も広がってきているようだ。技術革新に伴い、音声認識の向上からさらなる作業効率化アップが期待できそうだ。
参照元:マイクロソフトが会議で文字起こしや翻訳を行うアプリ「Group Transcribe」を発表【TechCrunch Japan】