英国のロボット企業エンジニアド・アーツが人型ロボットの新機能を実証した
開発者は、ビデオの説明で次のことを示していますAmeca は、このデモで話したり翻訳したりするために GPT-3 言語モデルを使用しました。さらに、ロボットは、音声認識と音声生成のために DeepL 機械学習モデルと統合されました。
アメリカ人はさまざまな言語を話します。ビデオ: エンジニアリングアーツ
以前、Engineered Arts は能力を発揮しました。彼のロボットは、驚きや不満から嫌悪感まで、さまざまな感情をリアルに伝えます。研究者は、言語学習のためにGPT-3とGPT-4の2つのモデルを試したことに注目しています.同時に、後期モデルは応答が遅くなり、表情のリアルな伝達が減少しました。
チームは現在取り組んでいますEleven labs のボイス クローニング システムを使用するロボットのデモ バージョン。このモデルは、リップ シンクの追加の「音素生成」のおかげで、より複雑な顔の表情を使用します。近い将来、ロボットのアップグレード版が発表される予定です。
続きを読む:
特別食がマウスの脳腫瘍細胞の自己破壊を引き起こす
科学者たちは、プトレマイオスの謎の写本を解読しました。他のテキストの下に隠れていました
ハッブルが困惑した科学者の新しい画像