Strona główna » Ai e-book o sztucznej inteligencji » DALL-E 3 z integracją z ChatGPT

DALL-E 3 z integracją z ChatGPT

by kapdes
dalle-3-open-ai

Nowy system tekstowo-obrazowy DALL-E 3 firmy OpenAI oferuje znaczące ulepszenia w stosunku do swojego poprzednika

Jest natywnie zintegrowany z ChatGPT. Według OpenAI, DALL-E 3 wykazuje znaczne postępy w zakresie generowania obrazów, które dokładnie podążają za skomplikowanymi promptami. Obejmuje to dokładne reprezentowanie sceny z określonymi obiektami, ich wzajemnymi relacjami i szczegółami, takimi jak ludzkie ręce lub tekst na obrazie, typowe słabości poprzednich systemów przetwarzania tekstu na obraz.

DALL-E 3, podobnie jak DALL-E 2 i inne systemy zamiany tekstu na obraz, obsługuje różne style, od artystycznych abstrakcji po rysunki komiksowe i fotorealizm. 

DALL-E 3 będzie aplikacją ChatGPT

Kolejną nowością jest to, że DALL-E 3 stanie się aplikacją ChatGPT dla płacących użytkowników ChatGPT Plus. Według OpenAI, ChatGPT może być używany jako partner podpowiedzi dla DALL-E 3, aby pomóc w burzy mózgów i optymalizacji prompty.

Jeśli wynikowy obraz jest bliski, ale nie dokładnie taki, jak zamierzano, użytkownik może go poprawić, mówiąc ChatGPT, co należy zmienić. Według OpenAI to konwersacyjne generowanie obrazu powinno zmniejszyć potrzebę stosowania skomplikowanych podpowiedzi. Firma twierdzi, że skomplikowana „inżynieria podpowiedzi” nie jest już konieczna.

OpenAI twierdzi, że wszystkie obrazy wygenerowane przez DALL-E 3 są w pełni własnością ich twórców.

Obrazy mogą być ponownie wykorzystywane, wprowadzane na rynek i sprzedawane.

Uruchomienie DALL-E 3 w ChatGPT-Plus, ChatGPT Enterprise i za pośrednictwem API planowane jest na październik. Samodzielna wersja DALL-E 3 za pośrednictwem OpenAI Labs, podobna do DALL-E 2, pojawi się jeszcze tej jesieni.

OpenAI oferuje artystom możliwość rezygnacji z ich pracy – dla przyszłego modelu

Główną zmianą i ograniczeniem w porównaniu do istniejących systemów graficznych jest to, że DALL-E 3 odrzuca monity zawierające nazwiska żyjących artystów. Jest to popularna metoda w innych systemach graficznych, aby nadać systemowi kierunek stylistyczny.

Co więcej, artyści mają możliwość wykluczenia swoich obrazów z treningu przyszłych (!) modeli obrazów OpenAI.

To z kolei może oznaczać, że DALL-E 3 jest nadal szkolony przy użyciu prac tych artystów, co może prowadzić do dalszych dyskusji na temat praw autorskich. OpenAI może być w stanie dostarczyć zaktualizowane wersje DALL-E 3 po okresie rezygnacji.

Prompty z nazwiskami znanych osób powinny być również odrzucane ze względów bezpieczeństwa, aby zapobiec, na przykład, generowanym przez sztuczną inteligencję obrazom polityków, które stały się wiralowe w mediach społecznościowych, jak to miało miejsce w przypadku Midjourney.

OpenAI planuje zająć się tymi i innymi zagrożeniami, takimi jak wizualna nadmierna lub niedostateczna reprezentacja lub niewłaściwe wykorzystanie do propagandy, za pomocą technik red-teaming. OpenAI testuje również wewnętrznie narzędzie, które może wykryć, czy obraz został wygenerowany za pomocą DALL-E 3.

Źródło: openai.com/dall-e-3

Pozostałe artykuły