Crypto news

26.03.2025
08:35

OpenAI добавил в ChatGPT генератор изображений на базе GPT-4o

Чат-бот ChatGPT от OpenAI

ИИ-стартап OpenAI добавил в ChatGPT и Sora генератор изображений на базе модели GPT-4o. Он доступен всем пользователям продуктов компании. 

Ранее для создания картинок в ChatGPT применялась модель DALL-E 3, а за работу с текстом отвечала GPT-4o. Теперь последняя применяется и для генерации изображений в чат-боте. 

Пример сгенерированной фотографии по промпту: «Широкоформатное изображение стеклянной доски, сделанное на телефон, в комнате с видом на мост Бэй-Бридж. В поле зрения видна пишущая женщина в футболке с большим логотипом OpenAI. Почерк выглядит естественным и немного беспорядочным, и мы видим отражение фотографа». Данные: OpenAI.

GPT-4o «думает» немного дольше DALL-E 3 в ходе создания работы. Это необходимо для генерации более точных и детализированных изображений, подчеркнули в OpenAI. Модель способна редактировать существующие картинки, в том числе с людьми, трансформируя или убирая детали — объекты на переднем и заднем плане.

«Создавать и настраивать изображения так же просто, как общаться в чате с помощью GPT-4 — просто опишите, что вам нужно, включая любые особенности, такие как соотношение сторон, точные цвета с помощью шестнадцатеричных кодов или прозрачный фон», — подчеркнула OpenAI. 

CEO стартапа Сэм Альтман подчеркнул «невероятность» нового продукта.

«Я помню, как видел некоторые из первых изображений, сделанных этой моделью, и не верил, что они действительно созданы искусственным интеллектом. Мы думаем, что людям это понравится, и с нетерпением ждем результатов творческой деятельности», — написал он.

Он продемонстрировал изображение, сгенерированное во время презентации нового инструмента. Пользователи обратили внимание, что ИИ так и не научился создавать для людей пять пальцев. 

Компания подчеркнула наличие цензуры для борьбы с генерированием изображений, которые могут нарушать политику фирмы. Это касается материалов о сексуальном насилии над детьми, фейков, наготы реальных людей и так далее. 

Напомним, в марте руководитель отдела по разработке Sora Рохан Сахай заявил о желании OpenAI интегрировать видеогенератор в ChatGPT. 

В декабре 2024 года стартап выпустил инструмент для создания видео в публичный доступ. Нейросеть создает ролики по текстовым промптам, «оживляет» изображения, расширяет существующие работы и заполняет недостающие кадры.