Medycyna obrazowa to obszar szczególnie wymagający, gdzie interpretacja wyników może być nie tylko trudna, ale i wielowymiarowa. W taki oto kontekście modele sztucznej inteligencji (AI) wyrastają na nieocenionych pomocników lekarzy, analizując obrazy, które mogą wskazywać na obecność choroby czy innych niepokojących zmian. W powiększającym się morzu danych diagnostycznych AI jest jednakże wyzwaniom: modele AI często podają jedno rozwiązanie, podczas gdy w rzeczywistości obrazy medyczne mogą mieć wiele interpretacji.
Niech przykładem posłuży analiza małego guzka na skanie płuc. Zapytaj pięciu ekspertów, aby zaznaczyli obszar zainteresowania, a możesz otrzymać pięć różnych zarysowań, gdyż każdy z nich może mieć swoje zdanie dotyczące początku i końca guzka. Aby sprostać tej problematyce, zespół badaczy z MIT, Broad Institute of MIT Harvard i Massachusetts General Hospital stworzył Tyche – system AI, który akceptuje niejednoznaczność segmentacji obrazów medycznych.
Segmentacja to proces etykietowania konkretnych pikseli na obrazie medycznym, które reprezentują ważne struktury, takie jak narządy czy komórki. Marianne Rakic, doktorantka informatyki w MIT i główna autorka badania, podkreśla, że posiadanie opcji może pomóc w podejmowaniu decyzji. Już samo zauważenie, że w obrazie medycznym istnieje niepewność, może wpłynąć na decyzje, dlatego ważne jest, aby wziąć tę niepewność pod uwagę.
Nazwany na cześć greckiej bogini przypadku, Tyche generuje wiele możliwych segmentacji dla pojedynczego obrazu medycznego, aby uchwycić niejednoznaczność. Każda segmentacja podkreśla nieco inne regiony, co pozwala użytkownikom wybrać najbardziej odpowiedni dla ich potrzeb.
Ale jak dokładnie Tyche funkcjonuje? Proces można opisać w czterech prostych krokach:
1. Uczenie na przykładach: Użytkownicy dostarczają Tyche zestaw przykładowych obrazów, zwanego “zestawem kontekstowym”, które pokazują zadanie segmentacji, jakie chcą wykonać. Te przykłady mogą zawierać obrazy segmentowane przez różnych ludzkich ekspertów, pomagając modelowi zrozumieć zadanie i potencjał dla niejednoznaczności.
2. Modyfikacja sieci neuronowej: Badacze wykorzystali standardową architekturę sieci neuronowej i wprowadzili modyfikacje, pozwalające Tyche radzić sobie z niepewnością. Dostosowali warstwy sieci tak, aby potencjalne segmentacje generowane w każdym kroku mogły “komunikować się” ze sobą i przykładami z zestawu kontekstowego.
3. Wiele możliwości: Tyche jest zaprojektowane tak, aby na podstawie pojedynczego obrazu medycznego i zestawu kontekstowego generować wiele przewidywań.
4. Nagradzanie jakości: Proces szkolenia został dostosowany tak, aby nagradzać Tyche za produkowanie najlepszych możliwych przewidywań. Jeśli użytkownik poprosi o pięć przewidywań, może zobaczyć wszystkie pięć segmentacji obrazów medycznych wyprodukowanych przez Tyche, nawet jeśli jedno może być lepsze.
Jedną z największych mocnych stron Tyche jest jego adaptacyjność. System może podejmować nowe zadania segmentacji bez potrzeby ponownego szkolenia od podstaw. W przeciwieństwie do tradycyjnych modeli AI do segmentacji obrazów medycznych, które wymagają obszernego treningu na dużych zestawach danych i wiedzy z zakresu uczenia maszynowego, Tyche można używać “od razu” do różnorodnych zadań – od wykrywania zmian płucnych na zdjęciach rentgenowskich po identyfikowanie nieprawidłowości mózgu na MR.
W przyszłości zespół badawczy planuje eksplorować użycie bardziej elastycznych zestawów kontekstowych, które mogą zawierać tekst lub różne typy obrazów. Ponadto, chcą rozwijać sposoby na ulepszenie najgorszych predykcji Tyche oraz umożliwić systemowi rekomendowanie najlepszych kandydatów na segmentacje.
Ostatecznie, w świetle licznych badań przeprowadzanych w dziedzinie AI i medycznych obrazów, w tym przełomów w badaniach raka piersi oraz diagnostyce AI rywalizującej lub nawet przewyższającej dokładność lekarzy w interpretacji obrazów, Tyche jawi się jako kolejny krok ku przyszłości, w której złożoność medyczna jest uznawana za atut, a nie przeszkodę.