Zastosowanie funduskamer w diagnostyce

Badanie dna oka stanowi jedno z podstawowych badań okulistycznych. Najczęściej badanie to wykonywane jest przy użyciu tzw. wziernika okulistycznego (oftalmoskopu) – podręcznego urządzenia zbudowanego ze źródła światła oraz układu powiększających soczewek i filtrów. Szersze pole widzenia oraz możliwość przestrzennego (stereoskopowego) zbadania dna gałki ocznej umożliwia tzw. wziernikowanie pośrednie z wykorzystaniem lamp szczelinowych oraz zewnętrznego źródła światła. Krokiem milowym w rozwoju badań dna oka stało się jednak wprowadzenie do powszechnego użytku funduskamer – urządzeń pozwalających na rejestrowanie zdjęć dna oka w powiększeniu. Współczesne funduskamery wyposażone są w ultraszerokokątną optykę oraz cyfrowe matryce rejestrujące wysokiej rozdzielczości. Wykorzystanie źródeł światła LED pozwala uzyskiwać obrazy o naturalnych barwach odpowiadających naturalnemu zabarwieniu dna oka. Urządzenia cechują się dużą ergonomią oraz prostotą obsługi, zaś proces rejestracji zdjęć oczu mieści się w pojedynczych minutach. Cyfrowy obraz dna oka jest bogatym źródłem informacji na temat wszelkich zmian chorobowych i innych nieprawidłowości (np. w siatce naczyniowej). Obrazy są niezwykle wyraźne i powstają bez konieczności poszerzania źrenicy. Są także niezwykle cenne w kontekście długoterminowej obserwacji dna oka, umożliwiając precyzyjne śledzenie progresji zmian.

Ogromną zaletą badań dna oka wykonywanych przy pomocy funduskamer jest możliwość pełnej i precyzyjnej diagnostyki w kierunku różnych schorzeń oka. Co ciekawe, obraz dna oka to nie tylko informacja świadcząca o stanie naszego narządu wzroku, to także swoiste „okno na świat”, pozwalające spojrzeć w głąb naszego organizmu. Na dnie oka widać bowiem jak na dłoni sygnały wielu chorób naczyniowych i neurologicznych, dzięki czemu monitorować możemy takie choroby jak cukrzyca czy miażdżyca. Ocena stanu naczyń krwionośnych w siatkówce pozwala na wczesną diagnostykę chorób ogólnoustrojowych, takich jak choćby nadciśnienie tętnicze.

Potencjał automatycznej analizy obrazów dna oka

Zainteresowanie sztuczną inteligencją (AI) w różnych obszarach życia, w tym w sferze diagnostyki medycznej, jest duże i nieustanie rośnie. Pojawienie się stosunkowo niedawno koncepcji uczenia głębokiego (DL, ang. deep learning) oraz zwiększenie powszechnej dostępności dużych mocy obliczeniowych sprawiło, że sztuczna inteligencja złapała przysłowiowy wiatr w żagle. W przeciwieństwie do klasycznych metod uczenia maszynowego opartych o ekstrakcję i analizę cech obrazowych, które pozwalają wyodrębniać i określać specyficzne właściwości obiektów, algorytmy głębokiego uczenia automatycznie ekstrahują i uczą się określonych wzorców, które optymalnie reprezentują dane. W zagadnieniach związanych z przetwarzaniem obrazów, w tym także obrazów medycznych, największą popularność zyskały konwolucyjne sieci neuronowe (CNN, ang. convolutional neural network). Sieci CNN składają się z wielu warstw, które przetwarzają dane za pomocą filtrów konwolucyjnych (operacji matematycznych mających zastosowanie w identyfikowaniu wzorców). Sukcesywna filtracja w kolejnych warstwach modelu stopniowo wyodrębnia przydatne informacje.

Cyfrowy obraz dna oka jest bogatym źródłem informacji na temat wszelkich zmian chorobowych i innych nieprawidłowości.

Wykorzystanie AI w analizie obrazów medycznych stało się już rzeczywistością, która nie omija także aplikacyjnego obszaru okulistyki. W ostatnich latach obserwujemy lawinowy wzrost prac badawczych wykorzystujących sieci CNN w diagnostyce różnych schorzeń ocznych. Prym wiodą tutaj w szczególności retinopatia cukrzycowa (DR), zwyrodnienie plamki związane z wiekiem (AMD) oraz diagnostyka jaskry. Dostępne są także systemy komercyjne posiadające certyfikaty CE oraz FDA. W obszarze retinopatii cukrzycowej modele DL potrafią uzyskać zdolność do identyfikacji schorzenia dochodzącą do 98% czułości oraz swoistości na wyselekcjonowanych zbiorach danych uczących. W realnych warunkach opieki zdrowotnej, w badaniu prospektywnym, wartości te co prawda spadały, lecz ciągle utrzymywały się poziomie powyżej 90%. Wysoką efektywność uzyskuje się także w zadaniach identyfikacji zmian towarzyszących retinopatii cukrzycowej (rozpoznawanie takich zmian jak wysięki, mikrotętniaki, krwotoki) oraz w ocenie stopnia zaawansowania choroby. W przypadku jaskry, stanowiącej jedną z głównych przyczyn ślepoty na całym świecie, automatyczna diagnostyka oparta o kolorowe zdjęcia dna oka skupia się przede wszystkim na segmentacji i ocenie obszarów dysku optycznego (OD) oraz jego wewnętrznej części tzw. kubka optycznego (OC). Wynika to z faktu, iż istotną przesłanką w ocenie rozwoju jaskry jest tzw. współczynnik kubka do dysku (CDR, ang. cup-to-disk), który wyliczanych jest z liniowych wymiarów obszarów OC/OD. Segmentacja obszarów OC/OD i estymacja współczynnika CDR jest zadaniem trudny z uwagi na bardzo subtelne i mocno subiektywne w ocenie granice kubka optycznego. Dodatkowo, region ten jest stosunkowo niewielki w stosunku do pozostałych struktur, stąd już niewielkie błędy w jego ocenie przekładają się na błędy całości metody. Modele CNN potrafią dość skutecznie radzić sobie z opisanymi powyżej zadaniami, co czyni je potencjalnie atrakcyjnym predykatorem występowania jaskry w kontekście diagnostyki przesiewowej.

Wyzwania AI w okulistyce

Ciągłe wyzwania jakie stoją przed rozwojem metod AI w zastosowań okulistycznych odnoszą się przede wszystkim do złożonego charakteru obrazów dna oka oraz niewystarczającej ilości wysokiej jakości zbiorów danych, które wciąż są dość ograniczone, a przede wszystkim często tworzone pod konkretne zadanie. W efekcie obrazy adnotowane do rozpoznawania retinopatii cukrzycowej nie mają oznakowanych innych zmian w strukturze dna oka, które mogą być kluczowe z punktu widzenia innych schorzeń. Dodatkowy problem stanowią kwestie etyczne oraz problem braku przejrzystości mechanizmów decyzyjnych sieci CNN, powodujący brak zaufania do nie zawsze jasnej i czytelnej decyzji modelu.

Obrazy adnotowane do rozpoznawania retinopatii cukrzycowej nie mają oznakowanych innych zmian w strukturze dna oka, które mogą być kluczowe z punktu widzenia innych schorzeń.

W Ośrodku Przetwarzania Informacji – Państwowym Instytucie Badawczym, w Laboratorium Stosowanej Sztucznej Inteligencji w ramach jednej ze ścieżek badawczych prowadzimy prace nad nowoczesnymi metodami raportowania strukturalnego badań dna oka wspieranych automatyczną analizą zdjęć, bazującą na modelach CNN. W ramach prowadzonych prac przy współpracy z CM Mavit opracowano wstępny model ontologii zmian obserwowanych na obrazach dna oka, który posłużył do stworzenia słownika, przy wykorzystaniu którego adnotowane są zdjęcia dna oka dla potrzeb stworzenia dużego zbioru danych. Obejmującego całe spektrum różnych zmiany naczyniowych, zapalnych i dystroficznych. Wstępny zbiór danych gromadzony był w zeszłym roku w ramach prowadzonego przez CM Mavit badania przesiewowego. Zaproponowano także wstępną wersję modelu CNN do multiklasyfikacji różnych schorzeń, który jednocześnie rozpoznaje niezależne zmiany i nieprawidłowości w obrazie dna oka, jak również klasyfikuje zdjęcie na poziomie określonego schorzenia. Taka konstrukcja modelu wynikała z faktu, iż określonym schorzeniom ocznym towarzyszą typowe, specyficzne zmiany obserwowane w obrazie dna oka. Pojedyncze typy zmian mogą co prawda występować przy różnych schorzeniach (np. występowanie wysięków towarzyszy różnym typom retinopatii), jednakże określona korelacja różnych zmian, ich lokalizacji i nasilenia, przekłada się na typowy obraz konkretnego schorzenia. Średnie wyniki dla badanych konfiguracji i schorzeń oscylowały na poziomie 95% dokładności, przy wskaźniku AUC na poziomie między 0.85 a 0.95. Indywidualnie słabsze wyniki klasyfikacji uzyskano dla wysięków miękkich (jako objawu) oraz dla zwyrodnienia plamki żółtej (jako schorzenia), co wynikało głównie z ich słabej reprezentatywności w zbiorze danych. Opracowanemu modelowi towarzyszył także dedykowany interfejs, prezentujący wizualne wyjaśnienia w postaci map atrybucji, których celem było wskazanie, które elementy na obrazie dna oka okazały się najistotniejsze dla modelu podczas podejmowania decyzji. Przyczynowy charakter modelu, wsparty wizualnymi wyjaśnieniami jego decyzji, wpisuje się w aktualne koncepcje rozwoju technik wyjaśnialnej sztucznej inteligencji. Obecnie prace te są kontynuowane w kierunku rozwoju modelu dedykowanego diagnostyce przesiewowej, który mógłby być wdrożony w trakcie badań medycyny pracy, co pozwoliłoby zaproponować nową jakość w profilaktyce chorób ocznych i cywilizacyjnych.