Калькулятор семантической близости для башкирского языка

Калькулятор семантической близости для башкирского языка

Вычисление семантических ассоциатов

 

     

Экранная клавиатура

 

Калькулятор сделан по образцу аналогичной разработки для русского языка. Семантические отношения между словами позволяет вычислять дистрибутивная семантика, которая основывается на представлении о том, что похожие по значению слова употребляются в похожих контекстах.
Данные для калькулятора представляют собой корпус текстов на башкирском языке объёмом 21 млн. словоупотреблений. Все слова в нём лемматизированы с помощью программы bashmorph, разработанной Борисом Ореховым. Использован алгоритм Continuous Bag-of-Words, размерность векторов 300, размер окна 2.

Семантические карты на основе калькулятора

© Борис Орехов, 2016.