Новый чат-бот GPT может рассказывать сказки, знает пару десятков языков и даже улавливает эмоции пользователя. И что еще лучше, многие функции улучшенной версией ИИ будут доступны бесплатно.
Компания OpenAI представила обновленную версию чат-бота на основе искусственного интеллекта GPT-4o. Буква «о» означает omni. По задумке разработчиков, новая модель является всесторонней.
Разговор с компьютером
Судя по презентации компании, новый GPT-4o станет более «человечным». Он сможет воспринимать запросы в виде текста, картинки или голоса и генерировать ответ практически в режиме реального времени. По данным OpenAI, на голосовой запрос ИИ теперь будет реагировать за 3,2 с, что сопоставимо со временем реакции человека в обычном разговоре.
«GPT-4o — это шаг к более естественному взаимодействию между человеком и компьютером: она принимает в качестве входных данных любую комбинацию текста, аудио и изображений и генерирует любую нужную комбинацию текста, аудио и изображений. И это невероятно важно, поскольку мы думаем о будущем взаимодействии между нами и машинами», — объяснила на презентации технический директор OpenAI Мира Мурати.
Голосовой помощник
Обновлённый чат-бот позволит пользователям использовать его больше как помощника. Например, человек сможет задать вопрос ИИ и прервать ответ, и бот отреагирует. К тому же GPT-4o распознает эмоции в голосе говорящего и сам моет отвечать в различных интонациях, и даже хихикать, в зависимости от разговора.
Эксперты говорят, что новый чат-бот omni станет серьезным конкурентом для таких помощников как Siri от Apple и Alexa от Amazon. На презентации компания презентовала, как OpenAI помогает решить уравнение, сочиняет и рассказывает сказку, рассказывает шутки и отвечает с сарказмом.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024
ИИ из фильмов
Также в новой версии ИИ может обрабатывать запрос и с камеры, и с голоса пользователя одновременно. GPT-4o поддерживает 50 языков, вдвое быстрее, чем предыдущая версия и имеет более высокие лимиты по скорости.
«Это похоже на ИИ из фильмов. И все же немного удивительно, что это реально», — говорит глава OpenAI Сэм Альтман.
В будущем функции чат-бота будут расширяться. Например, в будущем он сможет «смотреть» спортивную игру в прямом эфире и объяснять правила.
GPT-4o для ввода только текста и изображений запустили 13 мая. Полный вариант с поддержкой видео появится в ближайшие недели. Он будет доступен в платной и бесплатной версии, но в последней с ограничениями.
Фото: denisismagilov / depositphotos.com