Badania

Katedra Lingwistyki Komputerowej prowadzi badania nad automatyczną analizą tekstu polskiego, kładąc główny nacisk na analizę słownictwa i budowę słowników komputerowych. Badania zespołowe skupiają się na trzech obszarach.


Słownik fleksyjny języka polskiego (SFJP). Podstawowym narzędziem przetwarzania tekstu jest słownik fleksyjny , tj. program sprowadzający formę tekstową wyrazu, np. psa do postaci hasłowej pies i przypisujący wyrazowi charakterystykę gramatyczną, czyli rzeczownik męski żywotny.

Słownik semantyczny języka polskiego (SSJP). Zidentyfikowany za pomocą słownika fleksyjnego wyraz może uzyskać interpretację semantyczną, gdy odwołamy się do przechowywanego w słowniku semantycznym relacyjnego opisu znaczenia, gdzie relacje określają łączliwość definiowanego znaczenia z innym znaczeniami, np. paradygmatyczne  ‘podrzędnik – nadrzędnik’  pies – zwierzę i syntagmatyczne, np ‘działanie’   pies – szczekać, merdać.

Eksperymentalna sieć leksykalna języka polskiego (SLJP). Algorytm przetwarzający strukturę semantyczną tekstu może takkże użyć wiedzy o naturalnych powiązaniach pomiędzy wyrazami, że np. krzesło jest jest w ludzkiej pamięci silnie powiązane ze stołem, co pozwala wnioskować, że krzesło  obecne w strukturze semantycznej zdania także wtedy, gdy nie ma reprezentacji leksykalnej, np. goście siedzieli przy stole. Wiedza o naturalnych powiązaniach jest przechowywana w eksperymentalnej sieci leksykalnej.