Mastodawn

OpenAIの新たなAIモデル「GPT-4o」は、人間のようにリアルタイムにテキスト、音声、写真を分析して返答でき、Siriを原始的に見せる

OpenAIは本日オンラインイベントを開催し、オーディオ、ビジョン、テキストを“リアルタイム”で推論できる新たな基幹モデルである「GPT-4o」（oはOmniを表す）を発表した。ネーミングからすると、OpenAIの中でこれはGPT-4の漸進的なバージョンアップという位置づけかも知れないが、その進化はパフォーマンスと効率性において新たな基準を打ち立てるものでもある。 https://www.youtube.com/watch?v=DQacCB9tDaw テキスト、ビジョン、オーディオの入出力を同じニューラルネットワークで処理する初めてのモデルこれまでのトップレベルのモデルだったGPT-4 […]

https://xenospectrum.com/openais-new-ai-model-gpt-4o-can-analyze-and-respond-to-text-voice-and-photos-in-real-time-like-a-human-making-siri-look-primitive/