„Sztuczna inteligencja przestała być ciekawostką, a stała się nowym językiem komunikacji wizualnej. Dziś pozwala nie tylko przyspieszać produkcję wideo, lecz także tworzyć światy, historie i jakości obrazu, które jeszcze niedawno były zarezerwowane dla największych budżetów” – o praktycznym wykorzystaniu AI w obszarze wideo, zmianie procesu kreatywnego oraz nowych możliwościach dla marek i marketerów opowiada Marcin Rossa, dyrektor kreatywny i reżyser, założyciel studia Creait.me.
Marcin Rossa
Dyrektor kreatywny oraz twórca kampanii filmowych i reklamowych dla międzynarodowych marek i instytucji. Od siedmiu lat konsekwentnie rozwija wykorzystanie sztucznej inteligencji w produkcjach wideo. Jego filmy były prezentowane i nagradzane na międzynarodowych festiwalach w Hollywood, Nowym Jorku, Miami, Tokio czy Rzymie. Na Festiwalu w Wenecji znalazł się w gronie 50 najlepszych twórców AI na świecie.
Słuchaj „Marketer+” Podcast
Założyciel studia Creait.me – jednego z pierwszych w Europie zespołów wyspecjalizowanych w produkcjach filmowych realizowanych z wykorzystaniem AI. Studio tworzy sceny i sekwencje do seriali telewizyjnych, kampanii reklamowych oraz produkcji kinowych. Jego działalność mieści się na styku filmu, narracji i zaawansowanych narzędzi generatywnych.
Kiedy zrozumiałeś, z jakimi możliwościami wiąże się wykorzystanie sztucznej inteligencji w obszarze wideo?
Mam 20-letnie doświadczenie w pracy dyrektora kreatywnego i reżysera. Pierwszy eksperymentalny projekt z wykorzystaniem AI przeprowadziłem z Uniwersytetem Warszawskim blisko siedem lat temu. Mało kto mówił wtedy o sztucznej inteligencji w kontekście wideo. To był jeszcze etap generowania statycznych obrazów, bo narzędzia do tworzenia filmów właściwie nie istniały. Wygenerowanie jednego obrazu trwało wtedy kilkanaście godzin, więc trudno było mówić o produkcyjnym zastosowaniu. To było raczej badanie granic technologii niż narzędzie pracy.
Mimo to po intensywnej postprodukcji wykorzystaliśmy materiał do druku. Już wtedy zobaczyłem, że dzieje się coś ważnego. A potem, wraz z rozwojem narzędzi, stało się jasne, że to nie chwilowa nowinka, tylko technologia, która realnie zmienia sposób tworzenia obrazu – najpierw statycznego, a później również wideo.
Prawdziwy przełom nastąpił w momencie, gdy zacząłem realizować coraz bardziej złożone projekty i zobaczyłem, że mogę osiągać efekty, które wcześniej były dostępne wyłącznie dla dużych studiów filmowych z ogromnym zapleczem produkcyjnym. Po raz pierwszy mogłem przełożyć to, co mam w głowie, bezpośrednio na wideo, w dużej mierze z ominięciem ograniczeń logistycznych, lokalizacyjnych czy budżetowych. Sztuczna inteligencja przestała być eksperymentem, a stała się nowym językiem komunikacji wizualnej.
Czyli rozwiązała problem, z którym twórcy zmagali się od lat: napięcie między wyobraźnią a budżetem?
Dokładnie tak. To była odwieczna walka – pomysł i wizja po jednej stronie, a realia produkcyjne po drugiej. AI przesunęło tę granicę. Dzięki temu mogę myśleć bardziej narracyjnie i emocjonalnie, a mniej zastanawiać się nad tym, czy coś da się zrobić. Oczywiście ograniczenia nadal istnieją, ale są zupełnie inne niż wcześniej.
Czy zgodzisz się z tezą, że jesteśmy dziś w nowej epoce komunikacji wizualnej?
Myślę, że tak, choć dużo zależy od tego, jak do narzędzi AI podchodzimy. Wśród marketerów, reżyserów czy osób decyzyjnych są bardziej i mniej świadomi użytkownicy. Niektórzy próbują za pomocą AI po prostu odtworzyć rzeczywistość jeden do jednego. Tymczasem ta technologia daje nam możliwość tworzenia zupełnie nowych światów i nowych uniwersów.
To właśnie najbardziej mnie w AI wciągnęło. Pozwala opowiadać historie w sposób, który wcześniej był albo niemożliwy, albo zarezerwowany dla największych produkcji. Nagle nie muszę upraszczać pomysłu pod logistykę, budżet czy dostępność zasobów. Mogę iść za opowieścią, za emocją. Dla kreacji to ogromna zmiana. Zmienia się nie tylko sam proces produkcji, lecz także sposób myślenia o obrazie.
Spróbujmy przełożyć to na język marketerów. Co AI w wideo realnie zmienia z perspektywy marek i działów marketingu? Gdzie widzisz dziś najważniejsze zastosowania?
Generatywne wideo sprawdza się wszędzie tam, gdzie trzeba tworzyć dużo treści albo działać bardzo szybko. Od sesji zdjęciowych, przez krótkie rolki i formaty do social mediów, po pełne spoty, short filmy, a nawet serie budowane wokół marki.
Bardzo ciekawym obszarem jest Real Time Marketing. W Stanach Zjednoczonych widać już, że RTM nie kończy się na internecie –
można go robić także w telewizji. Widziałem przykład marki, która zauważyła duże zainteresowanie igrzyskami olimpijskimi i błyskawicznie przygotowała reklamę telewizyjną nawiązującą do tego wydarzenia. To pokazuje, że nagle pojawiają się zupełnie nowe możliwości reagowania na bieżące wydarzenia. Oczywiście nie w każdym przypadku chodzi o kilka godzin, ale sam fakt, że taka szybkość staje się możliwa, jest rewolucyjny.
Sam zrobiłem niedawno test RTM. Przygotowałem eksperymentalny materiał, żeby sprawdzić, jak zadziała organicznie i czy platforma nie zmniejszy zasięgów treści generatywnych. W ciągu 48 godzin bez żadnej promocji materiał osiągnął ponad półtora miliona wyświetleń na Facebooku. Ten wynik mnie zaskoczył, a zarazem utwierdził w przekonaniu, że umiejętnie wykorzystane AI potrafi przynieść bardzo zadowalające efekty.
A jak AI sprawdza się w bardziej klasycznych kampaniach internetowych czy telewizyjnych?
Zastosowań jest coraz więcej i cieszę się, że widać to także w polskich mediach. Z jednej strony AI sprawdza się w klasycznych reklamach telewizyjnych lub digitalowych, z drugiej strony świetnie działa wtedy, gdy marka chce przetestować nowy kierunek komunikacyjny.
Przygotowywaliśmy ostatnio projekt dla dużej marki, w którym generatywne wideo stało się punktem wyjścia do pełnoskalowej platformy komunikacyjnej. Stworzyliśmy trzy spoty, które służyły do wewnętrznego przetestowania różnych rozwiązań. Bez pełnego planu zdjęciowego, za to z możliwością szybkiego sprawdzenia, co działa. Eksperyment okazał się udany i materiały zostaną wdrożone.
Są też reklamy, które wcześniej nagrywaliśmy, a dziś możemy to zastąpić posłużeniem się AI. Dobrym przykładem jest branża automotive. Do tej pory przygotowanie spotu wymagało przewiezienia samochodu na plan, zamknięcia drogi, uzależnienia od pogody, pozwoleń, logistyki i dużych kosztów. Alternatywą było CGI, które również jest czasochłonne i kosztowne. Dziś, gdy mamy packshot samochodu, jesteśmy w stanie zrobić z nim praktycznie wszystko w środowisku sztucznej inteligencji. To pozwala na zupełnie nowy poziom pracy.
Brzmi to też jak ogromna szansa dla mniejszych marek, które dotąd nie mogły sobie pozwolić na duże produkcje.
To technologia, która dla mniejszych graczy może być naprawdę przełomowa. Obniża barierę wejścia i daje dostęp do jakości oraz języka wizualnego wcześniej zarezerwowanych dla największych budżetów. Dzięki temu mniejsze marki mogą dziś konkurować z dużo większymi pod względem wizualnym i komunikacyjnym.
Widzę to także poza reklamą. Robię filmy krótkometrażowe i efekty do produkcji fabularnych czy seriali. I dla mnie przełomem jest to, że krótkometrażowa produkcja może dziś konkurować na festiwalach z projektami wysokobudżetowymi. Jeszcze jakiś czas temu to wydawało się nieosiągalne.
A jak oceniasz poziom gotowości rynku? Czy marketerzy w Polsce rozumieją już potencjał wykorzystania sztucznej inteligencji w obszarze wideo?
Mam wrażenie, że nadal w niewielkim stopniu. Dla mnie to zaskakujące, ale sam dość wcześnie zacząłem pracować z AI, więc jestem przyzwyczajony do tej technologii. Od kilku miesięcy prowadzę intensywne dyskusje z CMO i działami marketingu i często słyszę: „Przespaliśmy ostatni rok. Dlaczego nie zainteresowaliśmy się tym wcześniej?”. W przeszłości dominowało podejście: „AI? Nie, nie wchodzimy w to”. Teraz, im lepiej marketerzy znają możliwości, optymalizacje i konkretne zastosowania, tym wyraźniej widzą szansę. I bardzo często wygrywa pragmatyzm. Bo jeśli można osiągnąć podobny albo lepszy efekt niż w CGI, a przy tym zrobić dwa razy więcej contentu w tym samym budżecie albo zrealizować projekt znacznie szybciej, to trudno ten argument zignorować.
Wiele osób wciąż ma obiekcje wobec generowanych postaci i filmowych spotów tworzonych z AI. Czasem widać w nich pewną sztuczność, powtarzalność, wręcz stockową estetykę. Myślisz, że mimo tego produkcje generowane wyprą tradycyjne reklamy?
To już się dzieje, ale ja jestem zwolennikiem podejścia hybrydowego. Bardzo często najlepsze efekty daje połączenie różnych metod. Robiliśmy reklamy na rynek amerykański w całości w AI i takie projekty rzeczywiście funkcjonują. Równocześnie pracowaliśmy też przy filmach fabularnych i serialach, gdzie stosowaliśmy rozwiązania hybrydowe. Można iść na plan zdjęciowy, odegrać scenę, a potem dobudować scenografię albo całe otoczenie. Można pracować z motion capture. Zresztą to nic nowego. Widzowie znają ten mechanizm choćby z „Avatara” czy postaci Golluma we „Władcy Pierścieni”. Tam prawdziwi aktorzy odgrywali sceny, a później w postprodukcji byli przekształcani w wykreowane postacie. Dziś podobne zabiegi można realizować z pomocą sztucznej inteligencji.
W praktyce oznacza to, że nadal potrzebujemy człowieka, który wniesie ruch, ekspresję i rytm sceny, ale możemy zmienić jego wygląd, otoczenie, a nawet całe uniwersum. Zdarza się, że sam jako reżyser odgrywam scenę, bo dokładnie wiem, jaki efekt chcę osiągnąć, a później postać, którą widzimy w reklamie, nie wygląda jak ja, ale zachowuje moje ruchy i energię. To samo można zrobić z aktorami.
Czy ten naturalizm będzie się poprawiał? Oczywiście. Tak samo jak kiedyś rozwijał się greenscreen czy efekty komputerowe. Ale warto pamiętać, że jakość zależy nie tylko od narzędzia, lecz także od tego, kto z niego korzysta.
Czyli problemem jest nie samo AI, tylko sposób jego użycia?
To prawda. Każdy ma dziś aparat fotograficzny w smartfonie, ale nie każdy zrobi nim dobre zdjęcie. Każdy może mieć dostęp do Photoshopa, ale nie każdy stworzy dobrą grafikę. Ze sztuczną inteligencją jest podobnie. Narzędzie jest ważne, ale kluczowe pozostają wiedza, doświadczenie, wyczucie i świadomość języka wizualnego.
Jeśli rozumiem, jaki kąt kamery chcę ustawić i co on symbolicznie komunikuje; jeśli wiem, jakim światłem chcę operować, jaki efekt emocjonalny osiągnąć, jaki rytm narracji zbudować – wtedy AI staje się przedłużeniem warsztatu, a nie jego zamiennikiem. Dlatego doświadczenie z tradycyjnej produkcji jest nadal bardzo istotne.
Co ten nowy język audiowizualny daje marketingowi? Jak marketer powinien myśleć o sztucznej inteligencji, jeśli chce tworzyć skuteczne kampanie wideo?
Przede wszystkim trzeba przestać myśleć o AI wyłącznie jako o narzędziu do robienia contentu, a zacząć traktować je jako narzędzie do budowania opowieści. Najważniejsze jest nie pytanie: „Co wygenerować?”, tylko: „Jaką emocję i jaką historię marka chce opowiedzieć?”.
Reklamy odnoszą sukces wtedy, gdy przyciągają pomysłem i emocją. Oczywiście AI można wykorzystać do masowej produkcji treści, ale jego prawdziwa siła ujawnia się wtedy, gdy pozwala rozwijać narrację w wielu formatach jednocześnie: od krótkich form, przez serie, aż po dłuższe historie, przy zachowaniu spójnego świata wizualnego.
Dla marketera kluczowe jest jasne określenie intencji, tonu i emocji, a nie rozpisanie wszystkiego klatka po klatce. Jeśli AI ma pogłębiać narrację, projekt trzeba prowadzić jak film – z myśleniem o rytmie, napięciu i znaczeniu, a nie wyłącznie o efekcie wizualnym.
Do tego dochodzi możliwość skalowania. Pojawiają się zapytania o budowanie całych seriali wokół marki. To wcześniej często było nieosiągalne. Robimy też product placement do filmu z użyciem AI, czyli wprowadzamy produkt do materiału na etapie postprodukcji. To również otwiera nowe drzwi.
Bardzo zmienił się także etap preprodukcji. Dawny animatik kojarzył się z prostym zlepkiem statycznych kadrów. Dziś przygotowujemy animatiki, które są już zaawansowanymi formami, bardzo bliskimi finalnemu spotowi. Oczywiście wymagają jeszcze dalszej pracy, ale przeskok jest ogromny. Granice między preprodukcją, produkcją i postprodukcją zaczynają się zacierać.
I jeszcze jedna ważna rzecz: AI bardzo pomaga na etapie ratowania materiału. Jeśli po zejściu z planu okazuje się, że brakuje jakiegoś ujęcia albo popełniono błąd, dziś nie jest to już dla mnie taki problem jak kiedyś. W wielu przypadkach da się to odtworzyć lub naprawić na późniejszym etapie.
A jak wygląda czas realizowania produkcji wideo z AI? Gdy marketer przychodzi z pomysłem na kampanię, o jakiej skali przyspieszenia mówimy?
Nie ma jednej odpowiedzi, bo każdy projekt jest inny. Różne są cele, zakres materiałów, liczba iteracji czy sposób pracy z klientem. Ale bez wątpienia czas produkcji jest dziś wyraźnie krótszy niż w klasycznej realizacji. Odpadają albo mocno skracają się kwestie logistyczne: transport, organizacja planu, uzgodnienia, pozwolenia. Mieliśmy nawet ekstremalne przypadki – pracę nad reklamą, na którą tradycyjnie poświęcilibyśmy miesiąc albo półtora, ukończyliśmy w trzy dni. Nie uważam, że to powinien być standard, bo czynnik ludzki, reżyserski i kreatywny jest w tym wszystkim bardzo ważny. Ale sama skala przyspieszenia jest bezdyskusyjna.
Oczywiście w większości sytuacji nadal nie jest to proces z dnia na dzień, jeśli mówimy o projekcie jakościowym. Nawet takie elementy jak castingi bohaterów wymagają pracy, choć i tu nastąpiła duża zmiana. Kiedyś trwało to kilka dni, dziś jesteśmy w stanie przeprowadzić AI-casting w dzień albo półtora. Co ważne, marka dostaje bohaterów, którzy nie będą pojawiać się w innych reklamach i mogą zostać zaprojektowani pod konkretną komunikację. To z kolei otwiera możliwość tworzenia własnych brand heroes, którzy stają się ambasadorami marki i wokół których można budować szerszą narrację. Może to dotyczyć postaci zarówno bardzo realistycznych, jak i całkowicie nierealnych: animowanych, stylizowanych, udających 3D, a nawet zwierzęcych. Ogranicza nas tylko wyobraźnia.
To ważne z punktu widzenia spójności marki. Taki bohater może żyć nie tylko w jednym spocie, lecz także w różnych kanałach komunikacji.
Spójność jest dziś bardzo istotna. Jeśli marka tworzy własną postać, może konsekwentnie rozwijać ją w telewizji, digitalu, druku, mediach społecznościowych. To pozwala osiągnąć zupełnie inny poziom komunikacji.
Bardzo ciekawe jest też to, że AI umożliwia dziś nie tylko pracę na poziomie obrazu, lecz także głębszą analizę warstwy dźwiękowej. Zamiast wybierać muzykę intuicyjnie ze stocków, można podejść do tego bardziej analitycznie: od DNA marki, archetypu, wartości i pożądanych cech. To otwiera kolejne możliwości budowania spójnej komunikacji.
A co z briefem? Jak powinien wyglądać dobry zestaw wytycznych pod projekt generatywny? Szczegółowy czy przeciwnie – bardziej otwarty?
Sam brief może być dość tradycyjny. Bardzo ważne są dla mnie informacje o DNA marki, jej tonie, kontekście i celu komunikacyjnym. Natomiast dobrze jest, aby brief opisywał intencję, sens i emocję, jaką chcemy wywołać, zamiast szczegółowo rozpisywać, jak dokładnie coś ma wyglądać. Zbyt sztywny brief zabija kreatywność – podobnie jak w klasycznej produkcji. Kiedy jest przestrzeń na interpretację, rośnie szansa na świeże rozwiązanie. Możemy przecież przedstawić emocję nie jeden do jednego, realistycznie, ale w sposób bardziej metaforyczny czy nieoczywisty.
W debacie o AI często pojawia się pytanie, czy sztuczna inteligencja zabija kreatywność, czy wręcz przeciwnie – pobudza ją. Jak ty to widzisz jako twórca?
Dla mnie AI zdecydowanie poszerza pole kreatywności. Po pierwsze dlatego, że mogę iść bardziej za pomysłem, bez przejmowania się budżetem. Po drugie dlatego, że daje mi ogromną możliwość testowania i iterowania.
Na planie zdjęciowym też robimy duble, żeby sprawdzić, które zagranie lepiej działa. Ale tam każdy dodatkowy wariant kosztuje czas, pieniądze, a czasem również nadgodziny, których nikt nie lubi. W narzędziach AI ta liczba iteracji może być większa. Mogę sprawdzić kilka kierunków i zobaczyć, czy da się jeszcze lepiej opowiedzieć to, co mam w głowie. Oczywiście i tu trzeba umieć postawić granicę, bo testować można bez końca. Ale sama możliwość eksperymentowania jest ogromną wartością.
Z perspektywy marketera oznacza to też chyba większe możliwości testów efektywnościowych.
Jestem dużym zwolennikiem testów A/B. Można wypuścić dwa warianty reklamy, zobaczyć, który performuje lepiej, i zostawić ten skuteczniejszy. Da się zmieniać drobne elementy: Call to Action, konstrukcję sceny, a nawet samych bohaterów.
To jest szczególnie ciekawe przy kampaniach międzynarodowych. Możemy stworzyć ten sam spot, ale dopasować bohaterów do kontekstu kulturowego czy społecznego konkretnego rynku. Przykładowo we Francji grupa odbiorców jest bardziej zróżnicowana etnicznie niż w Polsce, więc przy zachowaniu tej samej konstrukcji spotu można dostosować obsadę, bez powtarzania planów zdjęciowych w różnych wersjach.
A co z kosztami? Czy kampania z użyciem AI jest po prostu tańsza?
I tak, i nie. To nie jest magiczny przycisk, po którego naciśnięciu dostajemy gotową reklamę. Za tym nadal stoją ludzie, proces, doświadczenie i decyzje kreatywne. Ale jednocześnie AI daje realną optymalizację kosztową. Nie trzeba choćby wyjeżdżać za granicę, żeby zrealizować sceny z innego kraju. Mieliśmy taki przypadek przy filmie fabularnym – sceny stylizowane na zagraniczne były realizowane w Warszawie. To ogromna różnica organizacyjna i budżetowa.
W praktyce często można w tym samym budżecie marketingowym zrobić nawet dwa razy więcej contentu. Ale zmienia się też struktura kosztów. W projektach generatywnych najwięcej pracy dzieje się na początku, na etapie developmentu i wypracowania kierunku kreatywnego, a nie na końcu, jak często bywało w klasycznej produkcji. Im lepsze przygotowanie i szybsze decyzje po stronie klienta, tym bardziej przewidywalny staje się budżet, czas i harmonogram.
Jakie błędy najczęściej popełniają marki i agencje, które zaczynają pracę ze sztuczną inteligencją w obszarze wideo?
Po pierwsze: traktują AI jak tani i szybki skrót. Zakładają, że wystarczy
jedno polecenie i już mamy gotowy efekt. To prosta droga do rozczarowania jakością. I bardzo często właśnie stąd biorą się te plastikowe, generyczne realizacje, o których rozmawialiśmy.
Po drugie: brak jasnego kierunku i decyzyjności. Zbyt wiele iteracji bez spójnej wizji sprawia, że projekt się rozmywa. Po trzecie: nierealistyczne oczekiwanie, że z dnia na dzień powstanie perfekcyjny materiał high level. Owszem, AI daje ogromną optymalizację, ale nadal jest procesem. Często wymaga testów, wspólnej pracy i świadomych decyzji.
Ja bardzo mocno włączam klienta w ten proces jako partnera. I widzę, że to działa. Marketerzy dużo się uczą, kiedy przechodzą z nami przez cały pipeline projektowy. A później często mówią, że trudno im sobie wyobrazić powrót do dawnego modelu pracy.
Błędów i problemów związanych z wdrożeniem AI jest sporo, ale mimo wszystko mówisz zarazem o ogromnych możliwościach. Czyli powinniśmy patrzeć na tę zmianę technologiczną nie z lękiem, ale raczej z ciekawością i odwagą?
Dla mnie jest to zdecydowanie czas fascynacji. Przez wszystkie lata pracy nie widziałem tak szybkiego rozwoju technologii. To ekscytujące, bo granice da się dziś przesuwać praktycznie na bieżąco. Coś, co kilka miesięcy temu wydawało się bardzo zaawansowane, dziś można zrobić inaczej i lepiej. Ale sam dostęp do narzędzi nie wystarczy – trzeba je poznawać i uczyć się z nimi pracować. Widzę też, jak bardzo sztuczna inteligencja angażuje dziś ludzi po stronie biznesu: od CMO po zarządy i CEO, bo nagle wszyscy dostrzegają zupełnie nowe możliwości. I to jest chyba najważniejsze: jesteśmy w momencie, w którym trzeba odpowiedzieć sobie na pytanie, czy chcemy być odważni. Ci, którzy wcześniej wsiądą do tego pociągu, zyskają przewagę. Bardzo często słyszę dziś od marketerów i producentów: „Dlaczego nie zaczęliśmy wcześniej?”. To mówi samo za siebie.
Rozmawiał Sławomir Kruczek


