Midjourney potrzebuje „katalogu stylów”, który pomoże rozwiązać jego największy problem — i być może niedługo go otrzymamy

1 tydzień temu

Midjourney to potężna platforma, ale zbyt wiele imponujących funkcji kryje się za losowymi liczbami lub niejasnymi parametrami. Krzywa uczenia się jest intensywna, ale gdy wychodzi z Discorda i trafia na własną platformę, musi stworzyć jedną zabójczą funkcję — katalog stylów.

Obecnie istnieje wiele różnych sposobów nadawania stylu obrazowi w Midjourney, a jednym z najlepszych jest odniesienie się do innego obrazu lub użycie parametru –sref, dodając losową liczbę.

Każda liczba odpowiada swojemu własnemu stylowi — jak wykazałem w niedawnym teście — a przy dziesiątkach tysięcy potencjalnych stylów znalezienie tego, co działa, wymaga ciągłej serii prób i błędów.

Pomoc może być jednak w zasięgu ręki. Podczas ostatnich godzin pracy na Discordzie założyciel Midjourney, David Holz, powiedział, iż rozważa dodanie katalogu stylów do witryny.

Co to jest odniesienie do stylu?

Zasadniczo Odniesienie do stylu definiuje sposób, w jaki generator obrazów AI interpretuje wygląd i styl obrazu i jest szczególnie przydatne, jeżeli nie możesz wymyślić szczegółowego lub opisowego pomysłu.

Nick St Pierre, ekspert Midjourney, stworzył własny przewodnik po stylu, wykorzystując sztuczną inteligencję do automatycznego oznaczania i oznaczania obrazów według koloru, stylu lub oświetlenia oraz znajdowania powiązanych kodów. Kody mogą następnie stanowić skrót umożliwiający odtworzenie tego stylu obrazu w przyszłości.

Jednym ze sposobów wykorzystania Odniesień do stylu jest udostępnienie adresu URL wcześniej wygenerowanego obrazu. Jednak dostęp do biblioteki zawierającej informacje o wyglądzie każdego kodu zmieni zasady gry w Midjourney.

Wyjście z Discorda

W obu obrazach zastosowano ten sam monit, ale różne numery stylów (Zdjęcie: Midjourney/Future AI)

Nowe funkcje, takie jak katalog referencyjny, są częścią przeniesienia Midjourney z Discord. Utknął na platformie od chwili jej uruchomienia i był to dobry sposób dla uruchomionej firmy na osiągnięcie postępu i obniżenie kosztów zarządzania użytkownikami.

Niedawno uruchomił własny interfejs sieciowy, dzięki czemu jest dostępny dla wszystkich, kto stworzył co najmniej 100 obrazków w bocie Discord. Obejmuje to możliwość dostosowywania podpowiedzi obrazkowych dzięki przycisków, przełączników i wprowadzania tekstu zamiast parametrów z bardziej losowymi liczbami.

Nie pozostało jasne, jak mógłby działać katalog stylów, ale mógłby mieć postać przycisku w opcjach podpowiedzi, otwierającego nowe okno pokazujące różne style i umożliwiającego wybranie tego, który najlepiej pasuje do Twojego pomysłu na obraz. w tej chwili estetyką w sieci sterują trzy suwaki — stylizacja, dziwaczność i różnorodność.

Możesz oczywiście przez cały czas używać parametrów w wersji internetowej, więc jeżeli znajdziesz liczbę, która Ci się podoba, po prostu dodaj –sref na końcu znaku zachęty, tak jak w Discord. Jednak w przyszłości wydaje się, iż stosowanie stylów może stać się nieco prostsze.

  • OpenAI płaci badaczom, aby powstrzymywali superinteligentną sztuczną inteligencję przed zbuntowaniem się
  • Wyłącznie: przełom w sztucznej inteligencji może pozwolić Twoim kolejnym butom do biegania uczyć się i dostosowywać do sposobu poruszania się
  • Poznaj Alter3 — nowego, przerażającego humanoidalnego robota zasilanego przez OpenAI GPT-4
Idź do oryginalnego materiału