Лаборатория компьютерной филологии БашГУ: Һаумы, донъя!

Морфологический анализатор башкирского языка

Морфологический анализатор башкирского языка создан в лаборатории в сентябре 2012 года. Программа «Basmorph» предназначена для разбора словоформ башкирского языка, установления их основы, состава и грамматического значения аффиксов, добавляемых к основе при словоизменении и отчасти словообразовании (программа умеет определять словообразовательный аффикс абстрактных существительных -лыҡ/-лек и аффикс деятеля -сы/-се). Воспользоваться анализатором как онлайн - сервисом можно на странице http://lcph.bashedu.ru/cgi-bin/parser.pl

Разбор башкирских форм представлен в четырёх равнозначных вариантах: на русском, башкирском, английском языках и в виде стандартного вывода программы, где граммемы даются в виде сокращённых обозначений, по возможности соответствующих Лейпцигским правилам глоссирования.

Грамматические правила, заложенные в логику парсера, основаны на академических описаниях башкирской грамматики и дополнены неучтёнными в грамматиках наблюдениями над реальным функционированием языка.

Вывод сформирован по образцу русского парсера Mystem. Однако у башкирского анализатора есть свои особенности. В частности, добавлена возможность представления русскоязычных эквивалентов значений найденных основ. Эта возможность пока охватывает не весь состав словника, внутренний словарь программы находится в стадии пополнения.

Авторы благодарят за концептуальную помощь П.М. Аркадьева, Е.В. Шаульского и Т.И. Резникову.