Eksperci z Ośrodka Przetwarzania Informacji – Państwowego Instytutu Badawczego (OPI PIB) z sukcesem tworzą systemy, które mogą mieć zastosowanie w diagnostyce medycznej. Po platformie eRADS, która wspiera pracę radiologów zajmujących się rakiem prostaty, przyszedł czas na system wykrywający symptomy depresji w mediach społecznościowych. Nowe narzędzie ekspertów OPI PIB zdobyło pierwsze miejsce w konkursie Detecting Signs of Depression from Social Media Text, organizowanym w ramach konferencji Second Workshop on Language Technology for Equality, Diversity, Inclusion (LT-EDI-2022).
Sztuczna inteligencja (AI) w walce z depresją
Według Światowej Organizacji Zdrowia (WHO), na depresję cierpią ok. 322 miliony ludzi na całym świecie. Szybka diagnoza oraz leczenie może znacznie poprawić jakość życia pacjentów zmagających się z tą podstępną chorobą. W niektórych przypadkach, wczesna diagnoza może nawet uratować im życie. W związku z tym eksperci IT tworzą rozwiązania umożliwiające szybkie wykrywanie symptomów depresji, np. na podstawie tekstów publikowanych w mediach społecznościowych.
– Jestem dumny z naszego zespołu Laboratorium Inteligentnych Systemów Informatycznych, który zdobył pierwsze miejsce w konkursie Detecting Signs of Depression from Social Media Text. Konkurencja była duża – w inicjatywie wzięli udział eksperci z całego świata. System OPI PIB okazał się najlepszy – mówi dr inż. Jarosław Protasiewicz, dyrektor Ośrodka Przetwarzania Informacji – Państwowego Instytutu Badawczego (OPI PIB). Będziemy doskonalić nasze nowe narzędzie, aby skutecznie wspierało walkę z depresją. Działanie to wpisuje się w naszą strategię, w ramach której rozwijamy narzędzia oparte na sztucznej inteligencji, mające zastosowanie w medycynie i ochronie zdrowia człowieka – dodaje dyrektor OPI PIB.
Nagroda w konkursie, to nie pierwszy sukces ekspertów z Laboratorium Inteligentnych Systemów Informatycznych. Od wielu lat zajmują się oni przetwarzaniem języka naturalnego. Są twórcami m.in. Annobota – platformy wspomagającej tworzenie systemów do wykrywania emocji w tekście. Jest to innowacyjne narzędzie do etykietowania i tworzenia zbiorów danych poprzez rozmowę z chatbotem. System składa się z sześciu komponentów. Główną część stanowi Annobot Core, czyli aplikacja serwerowa, która integruje wszystkie inne moduły. Można stwierdzić, że jest ona takim sercem platformy. Są także dwa moduły służące do przypisywania etykiet do tekstów. Jeden zintegrowany z aplikacją Facebook Messenger, a drugi to komunikator Annobot chat napisany przez ekspertów z OPI PIB. Oprócz nich narzędzie składa się z panelu administracyjnego, modułu uczenia maszynowego oraz bazy danych. Narzędzie ekspertów OPI PIB wykrywa aż sześć podstawowych emocji.
Neuronowe modele języka
– Nasze rozwiązanie oparliśmy na neuronowych modelach języka, a dokładnie modelach typu RoBERTa. Poza użyciem standardowego modelu dla języka angielskiego, wytrenowaliśmy również własny model, na przygotowanym przez nas zbiorze danych. Składał się on z około 400 tys. postów – głównie dotyczących depresji, stanów lękowych oraz myśli samobójczych. Połączenie tych dwóch modeli dało najlepszy rezultat – mówi główny twórca systemu, Rafał Poświata, specjalista badawczo-techniczny w Ośrodku Przetwarzania Informacji – Państwowym Instytucie Badawczym.
Eksperci OPI PIB już dawno dostrzegli potencjał, jaki posiadają neuronowe modele języka. Instytut utworzył nawet Laboratorium Inżynierii Lingwistycznej (LIL), w którym specjaliści IT budują inteligentne narzędzia do odkrywania wiedzy z dużych korpusów danych tekstowych i internetowych. To właśnie oni opracowali i wdrożyli Jednolity System Antyplagiatowy (JSA), z którego korzystają wszyscy promotorzy prac dyplomowych w Polsce. Temat neuronowych modeli języka jest jednak tak innowacyjny i obszerny, że również w innych jednostkach OPI PIB eksperci pracują nad tym zagadnieniem. Bardzo ciekawe i innowacyjne prace realizuje największe z laboratoriów instytutu, tj. Laboratorium Inteligentnych Systemów Informatycznych (LISI). Jego zespół opracował m.in. model Polish RoBERTa large, który wytrenowano na największym w Polsce korpusie tekstów. W 2021 roku kontynuowali oni prace i udostępnili dwa nowe modele – Polish RoBERTa base v2 oraz przeznaczony do zadań związanych z generowaniem tekstu w języku polskim model GPT-2. Jak już wspomniano, to właśnie zespół LISI również opracował nagrodzone narzędzie do wykrywania symptomów depresji.
Dokładne wyniki konkursu można znaleźć na stronie: https://competitions.codalab.org/competitions/36410#learn_the_details-results.
Sesja plakatowa, na której zostaną przedstawione wszystkie systemy biorące udział w konkursie, odbędzie się 27 maja 2022 roku w stolicy Irlandii, Dublinie.