W czasach, gdy sztuczna inteligencja zyskuje coraz większe możliwości, nad światem technologicznym wiszą pytania o prawo i moralność. Przykładem takiej sytuacji jest niedawna wypowiedź CEO YouTube’a, Neala Mohana, na temat potencjalnego naruszenia warunków korzystania z usługi przez OpenAI. W rozmowie z Bloomberga, Mohan wyraził obawy, że wykorzystanie materiałów z YouTube do trenowania modelu tekst-na-wideo Sora stanowiłoby „wyraźne naruszenie” tych warunków. Ta uwaga rzuca światło na rosnące napięcia między gigantami technologicznymi oraz na wyzwania, które niesie ze sobą rozwój generatywnych modeli AI.
Model Sora, będący nadal w fazie testów, jest przełomowym osiągnięciem OpenAI i stanowi kolejny krok w podboju wszystkich form mediów przez generatywną sztuczną inteligencję. Rozpoczynając od tekstu, przez obrazy, a teraz także dźwięk i wideo, AI zdaje się nie znać granic. Jednak ta nowa era niesie za sobą unikatowe ryzyka, jak np. generowanie niemal dokładnych kopii materiałów objętych prawami autorskimi. Już widzieliśmy to na przykładzie modelu tekst-na-dźwięk Suno, który potrafi odtworzyć utwory bardzo podobne do takich hitów, jak „Bohemian Rhapsody” grupy Queen czy „Dancing Queen” z repertuaru ABBA.
Chociaż OpenAI i inne firmy AI nie były dotychczas szczególnie przejrzyste w kwestii polegania na ogromnych ilościach danych pochodzących z internetu, w tym materiałów objętych prawami autorskimi, do trenowania swoich modeli, to firma uznała trudności związane z unikaniem objętych prawami autorskimi danych w procesie rozwoju technologii. W złożonym oświadczeniu do Izby Lordów Wielkiej Brytanii przyznano, że „niemożliwe jest zbudowanie technologii bez nich”. Ta „pomyłka freudowska” nieumyślnie obnażyła niewygodną prawdę dla branży generatywnej AI. Jednak naruszenie praw autorskich nie zostało jeszcze udowodnione w sądzie, co odzwierciedla fakt, że obecna wersja prawa autorskiego po prostu nie została stworzona z myślą o obecnej erze.
Mira Murati, CTO OpenAI, wyraziła niepewność co do konkretnych typów treści wykorzystanych do trenowania Sory, w tym czy jakiekolwiek materiały z YouTube były wykorzystane. W wywiadzie dla Wall Street Journal przyznała, że „nie jest tego pewna”, dodając, że wykorzystywane dane były albo „dostępne publicznie, albo licencjonowane”. Brak pełnej przejrzystości w OpenAI staje się coraz bardziej widoczny, zwłaszcza teraz, gdy firma przygotowuje się do wypuszczenia swojego przełomowego modelu – modelu, który już został wykorzystany w działaniach handlowych w Hollywood ze względu na jego potencjalne zastosowania w filmie i telewizji.
Sora już spowodowała, że producent Tyler Perry wstrzymał ekspansję swojego studia o wartości 800 milionów dolarów, co może zwiastować potężne przetasowania w przemyśle kreatywnym. Tymczasem CEO YouTube’a wypowiada się na temat Sory, wyrażając świadomość trwających dyskusji na temat praktyk trenowania AI i sugerując potrzebę wyjaśnienia przez OpenAI wykorzystania danych YouTube. Mohan wskazał, że twórcy mają określone oczekiwania, gdy przesyłają swoje prace na platformę, w tym przestrzeganie warunków korzystania z usługi, które zabraniają m.in. pobierania transkryptów czy fragmentów wideo.
Jasne jest, że Alphabet, macierzysta firma YouTube’a, która również intensywnie rozwija własne narzędzia AI, nie pozostanie obojętna na ewentualne bezpośrednie lub pośrednie wykorzystanie materiałów wideo z YouTube do trenowania Sory. Możemy więc spodziewać się reakcji. Ponadto, złoty wyścig o dane AI doprowadził do strategicznych partnerstw i umów licencyjnych między firmami technologicznymi a dostawcami treści. Wiele pozwów w dziedzinach generowania tekstu i obrazu jest w toku, ale pozostają one w dużej mierze nierozstrzygnięte. Na przykład, umowa licencyjna Reddita z Googlem na kwotę 60 milionów dolarów rocznie na szkolenie narzędzi AI ilustruje formalne układy, które zaczynają powstawać w branży. Podobnie, organizacje medialne, takie jak Associated Press czy Axel Springer, zawarły umowy, które pozwalają na wykorzystanie ich treści do trenowania AI, z zastrzeżeniem, że w odpowiedziach generowanych przez AI nastąpią atrybucje.
Generatywna sztuczna inteligencja staje przed nowymi wyzwaniami. Jest kosztowna w budowie i eksploatacji, a teraz firmy AI muszą płacić za dane, zamiast po prostu pobierać je z internetu. Wszystko to rzuca nowe światło na kwestie prawne i etyczne związane z rosnącą potęgą AI, której geniusz z pewnością nie zamierza wrócić do butelki.