W świecie nowoczesnych technologii, epoka informacyjna osiągnęła kolejny poziom – erę sztucznej inteligencji. Nieustanny wyścig gigantów branży IT w kreowaniu najbardziej zaawansowanych modeli AI obserwujemy z rosnącym podziwem, ale i niekłamaną ciekawością, co przyniesie jutro. Ostatnie 12 godzin to prawdziwy festiwal innowacji, gdzie Google, OpenAI oraz Mistral zaprezentowały swoje najnowsze modele, natychmiast definiujące dzisiejsze granice możliwości technologii.
Na fali tych wydarzeń Google DeepMind wypuściło na światło dzienne swojego Gemini Pro 1.5. Model ten wyróżnia się zdolnością do zrozumienia długich ciągów kontekstowych, co jest kamieniem milowym w dziedzinie obsługi dużej ilości danych. Jego unikalna architektura Mixture-of-Experts (MoE) pozwala na wydajniejszą i skuteczniejszą pracę w zastosowaniu do specyficznych zadań, przyspieszając tym samym analizę ogromnych zbiorów danych czy tworzenie zaawansowanych agentów obsługi klienta.
OpenAI nie pozostaje w tyle, publikując model GPT-4 Turbo z udoskonalonymi możliwościami przetwarzania matematycznego i wizualnego. Firma zwiastuje również niedaleką przyszłość, gdzie na rynku ukaże się jej kolejne dzieło – GPT-5, a także intrygujący model Sora przetwarzający tekst na wideo, który na razie nie ma godnych rywali.
Z kolei Mistral zaskoczył wszystkich, umożliwiając pobranie ich nowego modelu Mixtral 8x22B – pliku o wadze 281GB – za pomocą sieci torrent. Model ten, liczący imponujące 176 miliardów parametrów, wykorzystując długość kontekstu na poziomie 65,000 tokenów, wraz z zaawansowaną architekturą MoE, zapowiada się na przełom w obrębie otwartych źródeł na licencji Apache 2.0.
W tle tych doniosłych chwil, Meta przygotowuje grunt pod swoje najnowsze dzieło – Llama 3. Spekuluje się, że mniejsza wersja modelu może ujrzeć światło dzienne już za tydzień, z pełnym, otwartym źródłem w lipcu bieżącego roku. Llama 3 ma konkurować zarówno z mniejszymi modelami typu Claude Haiku czy Gemini Nano, jak i większymi, pełnoprawnymi i zdolnymi do rezonowania, na wzór GPT-4 czy Claude 3 Opus.
To ekosystem AI, kiedyś zdominowany przez ChatGPT, obecnie pęka w szwach od alternatyw. Każda duża firma technologiczna jest zamieszana, bezpośrednio lub poprzez znaczące inwestycje. Oczekiwania na rynkową dominację jednego gracza stają się coraz bardziej mgliste w obliczu tej wielości wariantów.
Na horyzoncie widać także zbliżanie się odległości pomiędzy modelami o zamkniętym źródle od OpenAI, Anthropic, Google itp., a otwartym źródłem od Mistral, Meta i innych. Mimo że modele open-source nadal pozostają relatywnie niedostępne dla ogółu społeczeństwa, widać tu zarys zmiany.
Czy jednak te modele reprezentują rzeczywisty postęp w uczeniu maszynowym, czy to tylko kolejny krok w ewolucji? Opinie są podzielone. Elon Musk przewiduje, że AI przewyższy inteligencję ludzką w ciągu roku, podczas gdy Yann LeCun z Meta upiera się, iż AI pozostaje daleko w tyle za nami w kwestii rzetelnych miar inteligencji.
Tymczasem Meta dąży do stworzenia AI napędzanego przez obiekty, które lepiej rozumie świat i próbuje wokół niego planować oraz wnioskować. A OpenAI koncentruje się na poprawie zdolności rozumowania AI i radzenia sobie z bardziej złożonymi zadania.
Podczas gdy rok 2024 wkracza w letnie miesiące, społeczność AI i społeczeństwo szeroko będą uważnie obserwować, jakie przełomowe rozwinięcia wyłonią się z laboratoriów tych technologicznych gigantów. Do końca roku na pewno będziemy świadkami bogatego spektrum wyborów w świecie AI.
Źródło: DailyAI