Научни интереси: Математическа, компютърна, съпоставителна и корпусна лингвистика, представяне и обработка на знания, технологии за обработка на естествени езици, изкуствен интелект, дискретна математика. Основни резултати, включващи проектиране и разработка на дигитални езикови ресурси и програмни средства за обработка български език: TEI-съвместими лексически спецификации за кодиране и обработка на дигитални корпуси и лексика; съпоставими и многоезични корпуси (паралелни, анотирани и подравнени) – MTE българо-английски корпус, българо-полски корпус, българо-словашки корпус, българо-полски-литовски корпус; лексически бази данни за интегрирани многоезични ресурси; моно- и двуезични речници.