В понедельник OpenAI представила нового чат-бота с некоторыми впечатляющими — или причудливыми, в зависимости от вашей точки зрения — возможностями. Благодаря своей способности видеть, слышать и разговаривать как реальный человек, руководители OpenAI продемонстрировали, как новейший ChatGPT может переводить разговоры в режиме реального времени и рассказывать сказки на ночь разными голосами.
Руководитель отдела frontiers research OpenAI Марк Чен попросил чат-бота рассказать “сказку на ночь о роботах и любви”.
“О, сказку на ночь о роботах и любви? Я тебя прикрою!” — немедленно откликнулся восторженный женский голос. “Давным-давно, в мире, не слишком отличающемся от нашего, жил робот по имени Байт. Байт был любопытным роботом. Всегда что-то исследующим”.
Чен перебил: “Я хочу, чтобы в твоем голосе было чуть больше эмоций, чуть больше драматизма”.
“Понятно. Давайте добавим немного драматизма”, — сказал ChatGPT-4o, снова начиная свой рассказ, но на этот раз более глубоким голосом и с большей интригой.
Чен снова вмешался: “Нет, нет, нет, ChatGPT, я действительно хочу максимальных эмоций, например, максимальной выразительности, гораздо больше, чем ты делал раньше”.
“Понятно. Давайте усилим драматизм”, — ответил он, снова повторив свою вступительную реплику гораздо более громким, еще более драматичным голосом. Мира Мурати, технический директор OpenAI, попросила чат-бота переключиться на историю голосом робота; он подчинился. Затем вмешался коллега-исследователь Баррет Зоф, попросив петь нараспев. ChatGPT вздохнул и начал петь.
Мурати Чен и Зоф показали, как ChatGPT-4o может переводить живой разговор с итальянского на французский, а также слушать ваше дыхание и выполнять дыхательные упражнения. Чат-бот в два раза быстрее GPT-4 turbo и доступен для бесплатных пользователей.
“Последние пару лет мы были очень сосредоточены на улучшении интеллекта этих моделей, и они стали довольно хорошими, — сказал Мурати. “Но это первый раз, когда мы действительно делаем огромный шаг вперед, когда дело доходит до простоты использования”.
Возможно, визуальные возможности ChatGPT впечатляют даже больше, чем его навыки ведения разговора в режиме реального времени. Чат-бот может смотреть на лицо человека через камеру телефона и по выражению его лица судить о том, что, по его мнению, он чувствует. Он может смотреть на экран компьютера пользователя через screen share и помогать решать математические задачи.
Мурати сказал, что возможности чат-бота, хотя и являются значительным улучшением, ставят перед нами “новые задачи, когда речь заходит о безопасности”.
“Наша команда усердно работала над тем, чтобы выяснить, как обеспечить защиту от неправильного использования”, — сказала она, добавив, что OpenAI сотрудничает с правительствами и компаниями “всех отраслей промышленности” для достижения своих целей. Она не стала вдаваться в подробности о проблемах безопасности, планах OpenAI или характере их партнерских отношений.