Вышла версия Midjourney 5.1, в которой значительно улучшено качество результатов, получаемых с помощью генеративного искусственного интеллекта.
Компания утверждает, что версия 5.1 движка «более ориентирована на мнение», что приближает ее к результатам, которые можно получить с помощью версии 4 Midjourney, но с более высоким качеством. Есть также режим «raw», для тех, кто не хочет получать изображения с такой сильной ориентацией на мнения.
Среди других заявленных улучшений — более высокая точность, уменьшение нежелательных границ или артефактов текста на изображениях, а также улучшенная резкость.
Тестирование Midjourney 5.1
Мы протестировали новую версию Midjourney, используя одни и те же подсказки в версии 5 и версии 5.1, и сравнили результаты. Все остальные настройки были оставлены без изменений, а для Midjourney было установлено базовое качество и средний стиль.
На всех изображениях ниже, четыре изображения слева — это Midjourney 5, а четыре изображения справа — версия 5.1.
Задание было таким: «Женщина, идущая по мощеной улице на закат»:
В Midjourney 5 была постоянная проблема с чрезмерно агрессивными, искусственно выглядящими бликами объектива, поэтому приятно видеть, что эта проблема решена в версии 5.1. Закат на изображениях версии 5.1 выглядит более естественно, с более теплым и интересным небом.
Вторая подсказка, которую мы использовали, была «взрыв на фабрике красок, векторное искусство»:
И снова изображения в Midjourney 5.1 намного сильнее, чем в версии 5. Они лучше используют цвет и предлагают более динамичные композиции. Особенно яркими являются верхнее левое и нижнее правое изображения из версии 5.1.
Лица стали настоящей сильной стороной результатов Midjourney, поэтому для следующего изображения мы попросили ИИ создать «крупный план ребенка в плавательных очках»:
Здесь мы можем увидеть, что Midjourney имеет в виду, говоря о том, что в версии 5.1 изображения стали более «субъективными». Изображения версии 5 слева — это прекрасные, но очень прямые, похожие на камеру смартфона снимки детей в очках. Изображения версии 5.1 справа имеют гораздо более выраженную редакционную атмосферу, как будто они были сделаны профессиональным фотографом. Особенно поражает снимок в правом нижнем углу.
Наконец, мы хотели проверить обещание о меньшем количестве текстовых артефактов, попросив «продавец газет на углу улицы, стиль 1950-х годов, сепия»:
Во-первых, примечательно, что обе версии неправильно поняли подсказку, изобразив, человека с газетой, а не продавца газет, но это можно легко исправить с помощью подсказки. В обоих случаях на заднем плане находится текст, а не сама газета, но разница между ними невелика. Текст в обоих наборах изображений выглядит нормально на расстоянии, но при приближении он становится практически бессмысленным. Изображения версии 5.1 имеют более сильную композицию, объект съемки заполняет большую часть кадра.
Как начать использовать Midjourney 5.1
В настоящее время последняя версия находится в стадии тестирования, но пользователи Midjourney могут переключиться на версию 5.1 по умолчанию с помощью команды /settings в Discord.
Компания планирует сделать Midjourney 5.1 режимом по умолчанию уже в конце этой недели.