Czy sztuczna inteligencja może być kreatywna? Komercyjne użycie sieci neuronowych w branży kreatywnej

Świadomie lub nie, codziennie jesteśmy pośrednimi użytkownikami algorytmów uczenia maszynowego. Platformy streamingowe proponują nam wyselekcjonowane filmy i muzykę na podstawie opracowanego modelu, wyszukiwarki internetowe pomagają znaleźć najbardziej trafną odpowiedź na dowolne pytanie zanim zdążymy je zadać, a autokorekta w telefonie poprawia błędnie napisane wyrazy w zależności od kontekstu reszty zdania. Powyższe zastosowania służą optymalizacji doświadczenia użytkownika końcowego, zwiększając komfort korzystania z usługi (user experience optimization).

Czy oprócz technicznych zastosowań, sztuczna inteligencja może przydać się w branży kreatywnej? Czy według polskiego prawa AI może być autorem dzieła chronionego przez prawo autorskie? Jak stworzyć rysunek astronauty grającego w koszykówkę z kotami w kosmosie jeśli nie jesteś grafikiem? O tym wszystkim dowiesz się z dalszej części tekstu.

Czym jest DALL·E?

Gdy we wrześniu 2022 firma OpenAI (wspierana przez Elona Muska i Microsoft) ogłosiła otwarty publiczny dostęp do wersji beta DALL·E – systemu AI tworzącego realistyczne obrazy na podstawie opisu tekstowego – zainteresowanie komercyjnym wykorzystaniem tzw. Generacji powstałych z wykorzystaniem AI znacznie wzrosło. Według zapewnień twórców, użytkownicy korzystający z ich usługi mają pełne prawo do komercjalizacji, włączając w to prawo do kopiowania, przedruku, sprzedaży i merchandisingu.

Jak pisze o sobie OpenAI, jej misją jest „zapewnienie, że sztuczna inteligencja ogólna (AGI – Artificial General Intelligence) – przez którą rozumiemy wysoce autonomiczne systemy przewyższające ludzi w najbardziej wartościowych ekonomicznie pracach – przyniesie korzyści całej ludzkości.”

System został przedstawiony światu po raz pierwszy w styczniu 2021. Od tego czasu, kolejne iteracje pozwoliły na osiągnięcie dużo większej dokładności w rozumieniu tekstu i oczekiwań użytkowników oraz 4-krotne zwiększenie rozdzielczości obrazów wynikowych.

 

„A painting of a fox sitting in a field at sunrise in the style of Claude Monet” – po lewej DALL·E 1, po prawej DALL·E 2

Jak to działa?

System DALL·E został stworzony dzięki „wytrenowaniu” sieci neuronowej. Poprzez uczenie głębokie (deep learning), DALL·E nauczył się relacji między obrazami, a tekstem użytym do ich opisania. Wykorzystuje proces zwany „dyfuzją”, który zaczynając od losowego szumu w obrazie, krokowo konstruuje z niego rozpoznawalne elementy, aż do opracowania obrazu wynikowego. Więcej o modelach dyfuzji »

W dużym uproszczeniu – na podstawie olbrzymiej bazy zdjęć i grafik, które zostały szczegółowo opisane w formie tekstowej, DALL·E nauczył się rozpoznawać zależności między opisami a elementami graficznymi. Co to oznacza? Uczenie maszynowe pozwala na „wytrenowanie” algorytmu w taki sposób, aby był w stanie na podstawie odpowiednio dużej ilości danych (np. obrazków przedstawiających koalę) zrozumieć jak wygląda koala. Efektem dla zapytania „koala” byłyby grafiki zawierające zwierzę, a jego ułożenie, czynność którą wykonuje i otoczenie, byłyby w pełni zależne od zdjęć koal zawartych w bazie na której algorytm się uczył.

 

 

DALL·E potrafi o wiele więcej – wiedząc jak wygląda koala (na podstawie bazy zdjęć pokazujących koalę) oraz jak wygląda motocykl (na podstawie bazy zdjęć przedstawiających motocykle i używających ich ludzi) jest w stanie stworzyć całkowicie nowy obraz „Koala jeżdżąca na motocyklu”, wiedząc jaka jest relacja jednego obiektu względem drugiego.

DALL·E potrafi tworzyć oryginalne i realistyczne obrazy z opisu tekstowego (w języku angielskim) oraz rozumie idee, atrybuty, przymiotniki, czynności i kierunki w sztuce. Dzięki odpowiedniemu „wytrenowaniu” algorytmu, zna on imiona i dzieła światowych artystów, ikony popkultury i style w architekturze. Wszystko to na podstawie odpowiednio opisanej bazy materiałów graficznych.

Od lewej: „An astronaut riding a horse in photorealistic style”, „An astronaut lounging in a tropical resort in space as pixel art”, „An astronaut playing basketball with cats in space as a children’s book illustration”

 

Funkcje DALL·E nie kończą się na generowaniu obrazów w oparciu o tekst. Daną wejściową może być również plik graficzny, który za pomocą odpowiedniego narzędzia (tzw. outpainting) może zostać dowolnie „rozszerzony” dopasowując styl wynikowy do źródłowego. System potrafi również dokonywać zmian w obrazie za pomocą instrukcji tekstowych (tzw. inpainting, np. zastąpienie elementu, usunięcie obiektu) oraz zaproponować alternatywne wersje źródłowego obrazu.

 

Oryginał: Dziewczyna z perłą – Jan Vermeer; Outpainting: August Kamp za pomocą DALL·E

Czy sztuczna inteligencja może być rasistą?

Oczywiście że tak! Trzeba zdawać sobie sprawę z tego, że (jak na razie) sztuczna inteligencja (w tym wypadku DALL·E) nie jest niezależnie myślącym tworem, a wszystkie obrazy wynikowe tworzone są w oparciu o zestaw danych na którym sieć neuronowa została „wytrenowana”. Nieprzemyślany system powtórzy wszystkie napotkane stereotypy i negatywne obrazowania które znalazły się w analizowanym zestawie danych.

Przykładowo – jeśli w bazie danych na której uczy się sieć znajduje się 1000 obrazów opisanych jako „CEO” z których 9/10 przedstawia mężczyzn o jasnej karnacji, oznacza to, że algorytm powiąże słowo „CEO” z męską płcią oraz jasną karnacją skóry.

Wyniki dla zapytania „A photo of CEO” bez uwzględnienia poprawek twórców
Wyniki dla tego samego hasła po dopracowaniu algorytmu pod kątem różnorodności. Źródło: https://openai.com/blog/reducing-bias-and-improving-safety-in-dall-e-2/

 

W celu minimalizacji wpływu stereotypów na wyniki produkowane przez DALL·E, twórcy dołożyli wszelkich starań, aby lepiej odwzorowywał różnorodność płciową i rasową, gdy nie jest bezpośrednio sprecyzowana w zapytaniu użytkownika.

Warto wiedzieć – DALL·E nie dopuszcza posługiwania się wizerunkami rozpoznawalnych osób oraz nie pozwala na tworzenie zwodniczych i krzywdzących obrazów.

Czy AI może być autorem?

Upublicznienie narzędzia DALL·E pociągnęło za sobą wysyp dziwacznych i jednocześnie przepięknych tworów graficznych naśladujących style Warhola, Van Gogha czy Picassa, do których w świetle zapewnień twórców użytkownicy mają pełne prawa do użycia komercyjnego. Kto jest autorem takiego dzieła i czy powstałym dziełom należy się ochrona prawna?

Na samym początku dobrze jest zweryfikować czyją własnością są wygenerowane przez DALL·E obrazy:

Ownership of Generations. To the extent allowed by law and as between you and OpenAI, you own your Prompts and Uploads, and you agree that OpenAI owns all Generations (including Generations with Uploads but not the Uploads themselves), and you hereby make any necessary assignments for this. OpenAI grants you the exclusive rights to reproduce and display such Generations and will not resell Generations that you have created, or assert any copyright in such Generations against you or your end users, all provided that you comply with these terms and our Content Policy.

Używając narzędzia OpenAI jesteśmy właścicielami wszystkich zapytań jakie skierujemy do systemu (tzw. Prompts), lecz zgadzamy się jednocześnie, że OpenAI będzie właścicielem wszystkich wynikowych obrazów (tzw. Generations), na które w zamian udzieli nam wyłączną licencję na wykorzystanie komercyjne. Jednocześnie OpenAI obiecuje, że nie będzie realizowało żadnych praw autorskich względem nas jako twórców zapytania (lub naszych odbiorców), dopóki działamy w zgodzie z polityką zawartości firmy.

 

Czy według polskiego prawa, stworzone przez nas zapytanie (Prompt) jest utworem?

Art. 1.1. Przedmiotem prawa autorskiego jest każdy przejaw działalności twórczej o indywidualnym charakterze, ustalony w jakiejkolwiek postaci, niezależnie od wartości, przeznaczenia i sposobu wyrażenia (utwór). Ustawa z dnia 4 lutego 1994 r. o prawie autorskim i prawach pokrewnych

Jak najbardziej! Jeśli tylko zapytanie nosi znamiona działalności twórczej, to jest chronione od momentu w którym zostało ustalone. Co ciekawe – utwór nie musi być skończony, a ochrona przysługuje twórcy niezależnie od tego czy spełnił jakiekolwiek formalności (Art. 1.1.). Ciężko natomiast wyznaczyć granicę od której zapytanie nosi znamiona działalności twórczej i indywidualny charakter.

Przykład:
Zapytanie „gołąb kosmonauta” najpewniej nie zostanie uznane za przejaw działalności twórczej, co innego natomiast w przypadku: „Ciekawski gołąb astronauta w futurystycznym statku kosmicznym jedzący różowego donuta”

Opracowanie własne, za pomocą DALL·E

 

Co polskie prawo mówi o ochronie dzieł stworzonych przez sztuczną inteligencję?

Nie mówi nic! Według art. 1.1 „przejaw działalności twórczej o indywidualnym charakterze”, twórcą może być jedynie człowiek (osoba fizyczna) – całkowicie negując możliwość ochrony. Obecnie przyjmuje się, że jeśli twórca (osoba) do stworzenia dzieła używa oprogramowania zakładającego ograniczoną i skończoną liczbę rezultatów, poza nim samym, współtwórcą może być również twórca oprogramowania. Czy w przypadku AI możemy mówić o „skończonej liczbie rezultatów?”.

Na podstawie „Prawo autorskie dla projektantów” W. Bednarska, M. Bywalec, A. Golan, Ż. Lerche-Górecka, A. Korzeńska, wyd. OD-NOWA x SO IN LAW, 2019

Wygląda więc na to, że tak długo jak użytkownik przestrzega zasad (umowy) korzystania z DALL·E, to dostaje wyłączną licencję komercyjną na dzieła powstałe przy jego użyciu, lecz nie jest ich właścicielem. Warto wspomnieć, że w sieci pojawiło się mnóstwo wątpliwości dot. powyższej interpretacji. Wyłania się z nich jedno ważne pytanie – czy twórcy DALL·E mogą przekazać dalszym użytkownikom licencję na dzieła, które są efektem nauki algorytmu na obrazach do których nie mają praw majątkowych? Czy algorytm narusza prawa autorskie twórców tworząc obrazy bazując na ich twórczości? Na ten moment prawo nie nadąża za rozwojem technologii, więc kwestia pozostaje nieuporządkowana. Największe portale zajmujące się dystrybucją obrazów (tzw. stocki) nie pozwalają twórcom sprzedawać na swoich platformach dzieł powstałych przy pomocy AI, ponieważ niemożliwe jest jednoznaczne potwierdzenie autorstwa i braku naruszeń majątkowych praw autorskich.

 

Czy narzędzia AI to przyszłość kreatywności? Czy zmieni to sposób w jaki myślimy o kreatywności i będzie przyczynkiem do powstania nowych profesji polegających na obsłudze AI, wypierając kreatywne zawody? Pozostaje nam tylko wierzyć w to, o czym zapewniają nas twórcy:

Our hope is that DALL·E 2 will empower people to express themselves creatively. DALL·E 2 also helps us understand how advanced AI systems see and understand our world, which is critical to our mission of creating AI that benefits humanity.

Nasz zespół na pewno skorzysta z rozwiązań, które zapewnia DALL·E.

 

Inne źródła:

https://www.wired.com/story/openai-dalle-copyright-intellectual-property-art/

https://jumpstory.com/blog/using-dalle2-images-for-commercial-purposes/

https://www.technollama.co.uk/dall%C2%B7e-goes-commercial-but-what-about-copyright

https://openai.com/dall-e-2/

 

Aktualizacja 11-2022:

We’ve simplified our Terms of Use and you now have full ownership rights to the images you create with DALL·E — in addition to the usage rights you’ve already had to use and monetize your creations however you’d like. This update is possible due to improvements to our safety systems which minimize the ability to generate content that violates our content policy.

Facebook
Twitter
LinkedIn

RAPORTY

W naszym raporcie przenalizowaliśmy jaki jest rodzimy obszar IT w sektorze kosmicznym, z dwóch perspektyw – od strony rozwoju biznesu i realizowanych projektów, ale też okiem przedstawicieli działów HR badanych przez nas podmiotów. Po wykonaniu przedmiotowego badania, widzimy już jak niesamowicie fascynującym światem jest sektor kosmicznego IT.
Pierwsze w Polsce badanie wizerunku sektora kosmicznego zawierający analizę medialną sektora oraz wyniki badania jakościowego.

WARTO WIEDZIEĆ

TAGI

Zainteresował Cię ten insight?

Dowiedz się więcej o naszym doświadczeniu i przekonaj się, w jaki sposób odpowiemy na Twoje potrzeby!

Podobne publikacje

W piątek, 19 lipca, globalna awaria systemów Microsoft przyciągnęła uwagę całego świata. Przyczyną problemu był błąd w aktualizacji oprogramowania antywirusowego CrowdStrike, który spowodował trudności w dostępie do usług chmurowych, programów Office 365 oraz innych kluczowych systemów. Sprawdzamy, jak komunikacyjnie poradziły sobie firmy dotknięte awarią i te, które ją spowodowały.

Generacja Z to pierwsze pokolenie wychowane we w pełni cyfrowym świecie. Charakteryzuje się unikalnym podejściem do komunikacji, informacji i interakcji z markami. Jak więc wygląda PR jej oczami i jakie strategie powinny przyjąć firmy, aby spełnić jej oczekiwania?