В статье рассматриваются лингвистические маркеры языка ненависти (hate speech) в пространстве интернет-дискурса и анализируются подходы к их использованию в системах автоматического обнаружения враждебного контента. Выявлены ключевые лексикосемантические, грамматические и прагматические маркеры, характеризующие враждебные высказывания в сетевом пространстве. Проведён анализ методов машинного обучения и моделей на основе трансформеров (BERT, ELECTRA), применяемых для идентификации языка ненависти в текстах социальных сетей. Установлено, что наибольшую сложность для автоматических классификаторов представляют имплицитные формы враждебности: ирония, кодированная лексика и контекстно-зависимые высказывания. Сделан вывод о необходимости междисциплинарного подхода, объединяющего лингвистическую теорию и компьютерные технологии.