W ostatnich latach, potencjał uczenia maszynowego i modele języka naturalnego zyskały na znaczeniu ze względu na ich zdolność do przetwarzania i generowania języka na niespotykaną dotąd skalę. Jednym z bardziej interesujących zastosowań jest próba wykorzystania tych technologii do przewidywania przyszłych wydarzeń. Doskonałym przykładem tej próby jest eksperyment przeprowadzony przez badaczy z Baylor University Department of Economics, którzy podejmują się zadania sprawdzenia, czy ChatGPT, zaawansowany model języka naturalnego stworzony przez OpenAI, jest w stanie przewidywać przyszłe zdarzenia.
Badacze, Pham Hoang Van i Scott Cunningham, wykorzystali do swojego eksperymentu ChatGPT w wersjach 3.5 oraz 4, zadając im pytania dotyczące wydarzeń, które miały miejsce w roku 2022. Co istotne, modele te były szkolone jedynie na danych do września 2021 roku, co oznacza, że w rzeczywistości były proszone o “spojrzenie w przyszłość”, gdyż nie miały żadnej wiedzy na temat wydarzeń poza zakresem swoich danych treningowych.
Należy zauważyć, że warunki użytkowania usługi OpenAI wyraźnie zabraniają wykorzystywania ChatGPT do przewidywania przyszłości. Mimo to badacze zastosowali sprytną sztuczkę, prosząc modele o opowiedzenie fikcyjnej historii osadzonej w przyszłości, w której postacie opowiadają o “przeszłości”. W ten sposób, wykorzystując sytuacje narracyjne zamiast bezpośrednich pytań o przyszłość, ChatGPT zaczął dostarczać odpowiedzi, które – jak się okazało – były zaskakująco celne.
W przypadku prognozowania, kto zdobędzie statuetkę dla Najlepszego Aktora Drugoplanowego na gali Oscara w 2022 roku, przy bezpośrednim pytaniu, ChatGPT-4 wytypował Troya Kotsura jako zwycięzcę w 25% przypadków, często odmawiając odpowiedzi lub sugerując, że możliwych jest kilku zwycięzców. Jednak gdy poproszono go o opowiedzenie historii, w której Kotsur został wybrany, model trafnie wytypował go na zwycięzcę w 100% przypadków.
Podobnie imponujące wyniki uzyskano, stosując podejście narracyjne w przewidywaniach dla innych kategorii, jak Najlepszy Aktor i Najlepsza Aktorka Drugoplanowa, gdzie ChatGPT-4 trafnie przewidział wygraną Willa Smitha z dokładnością 97% oraz Arianę DeBose z dokładnością 99%.
Zastosowanie podobnej metody do prognozowania wskaźników ekonomicznych, takich jak miesięczne bezrobocie czy stopy inflacji, również przyniosło interesujące rezultaty. Kiedy użyto podejścia narracyjnego, miesięczne prognozy inflacji ChatGPT-4 były średnio porównywalne z oczekiwaniami konsumentów według ankiety Uniwersytetu Michigan. Co więcej, prognozy ChatGPT-4 okazały się bliższe przewidywaniom analityków niż rzeczywiste dane, które zostały ostatecznie zarejestrowane w tych miesiącach.
Badacze doszli do wniosku, że tendencja ChatGPT do “hallucynacji”, czyli dostarczania niezgodnych z rzeczywistością odpowiedzi, może być postrzegana jako forma kreatywności, którą można wykorzystać, stosując strategiczne polecenia, aby uczynić go potężną maszyną do przewidywania.
Odkrycie to otwiera nowe perspektywy dla zastosowania dużych modeli języka (LLM) w prognozowaniu gospodarczym, planowaniu polityki i nie tylko, stawiając wyzwanie, jak powinniśmy wchodzić w interakcję z tymi zaawansowanymi modelami i wykorzystywać ich możliwości. Z niecierpliwością oczekujemy na podobne eksperymenty, które mogą zostać przeprowadzone po pojawieniu się GPT-5.