人が無意識下で行う自然な動作を再現する
フロントエンド AI の重要性

人が無意識下で行う自然な動作を再現する
フロントエンド AI の重要性


わたしたちのすべての行動は、五感で情報を取得し、
過去の経験に照らし合わせ分析し、決断するというプロセスを経ています。
このプロセスは、成長とともに何度も繰り返されて習慣化され、
無意識に行動するようになります。

例えば卵を手に持つとき、
幼児は力加減がわからず割ってしまうことがありますが、成長するにつれ経験を繰り返し、
意識せずに持つことができるようになります。いわゆる無意識下での認知行動です。
ロボットにこのような行動をさせるためには、高度なセンシング能力、高速で正確な分析力、
予想する能力、そして状況に適した行動力や会話力が必要になります。
これらのさまざまな知能を実現したのがフロントエンド AI です。

人にとって違和感がない行動をするために、フロントエンド AI は、
PALRO に高精度な制御を促し、会話や動作としてアウトプットします。
また深く試行して決断すべきことやより複雑な分析を要する場合は、
クラウド AI を使用した強力な知能により対応します。



信頼性の高い工学テクノロジー

富士ソフトは、長年、産官学連携でロボット制御の研究に取り組みノウハウを蓄積してきました。
その培ってきた制御ソフトウェアの求めるハードウェアを独自技術で開発し、 PALRO として誕生させました。
耐衝撃性・駆動耐久性・センシング制度・分析精度などのロボット工学テクノロジーを駆使して
ソフトとハードを調和させ、フロントエンド AI としての PALRO の高い性能と高信頼性を実現しました。


相手を見て話す
人の視野角は水平方向に約 200 度、垂直方向に約 125 度といわれています。
PALRO の視野角は水平方向に約 52 度、垂直方向に 40 度。人より狭い視野を補うために、周辺を 3D マップ化しており、
マイクと超音波センサーにより認識した人の位置を分析し、音源の方向、話し相手との距離を併用して、
話し相手の顔を素早く視野の中心に捉えて自然に向き合います。

曖昧な言葉の認識
日本語の肯定文、否定文の判断は難しい。
「~します。」「~しません。」文の最後が違うだけで意味は真逆になり、人でも聞き取りにくいことがあります。
PALRO の音声認識は最後の1文まで分析して正しい答えを導き出します。
また、並行して向き合う人の動作も分析しています。頭を盾に振ったら肯定・賛同。横に振ったら否定・反対。
答えは自然と動作や雰囲気としても現れます。PALRO は音声認識と画像処理を複合して、話し相手の意図を理解するのです。

即答も聞き逃さない
人は質問の答えが決まっていると、相手が話し終わってすぐに答えたくなるものです。
PALRO は、最適な音声認識用のデータ(待ち受け語)を準備し、
その時の周囲の雑音などを除去しながら話し相手の声を待ちます。
これにより、話し相手の声をクリアに聞き取ることができ、高い精度で音声を認識しています。
また、PALRO のフロントエンド AI が言葉の意味を解析、思考し、人と同じような会話を可能にしました。

気持ちがいい返事
「パルロ」と呼びかけて「ハイ」と答える。この間 0.4 秒。
「天気教えて」と話しかけて「天気ですね」と答える。この間も 0.4 秒。
コミュニケ―ションは、応答時間が気持ちよさを感じさせてくれる一つの要素。
PALRO は、本体の CPU で全てを処理することで、話の内容に合った応答時間(0.4~0.9秒)で返答や動作を行い、
コミュニケ―ションを快適にしています。
また、話の中で必要だと思われる詳細情報は、バックグラウンドでクラウドに随時アクセスしています。


見た瞬間、0.08 秒で名前を呼びかけます
PALRO は、人の顔を視野の中心で捉えるよう、常に高精度で予測し、顔を見た瞬間に検索を開始します。
この間 0.08 秒。フロントエンド AI の複合能力が、瞬時に個人を識別して「こんにちは。○○さん」と
話しかけることを可能にしました。