Жизнь современного общества тесным образом связана с информационными технологиями. В современном мире люди общаются не только между собой, но и с гаджетами, которыми ежедневно пользуются. Продуктивность такого «общения» обеспечивают цифровые (компьютерные) лингвисты — специалисты, совмещающие в себе знания в области изучения языка с навыками программирования.

Магистерская программа направлена на подготовку специалистов в области лингвистики и современных цифровых технологий. В процессе освоения дисциплин учебного плана студенты получают умения и навыки, необходимые для специалистов в области цифровой лингвистики, владеющих иностранными языками: автоматическая обработка текстов и их анализ при помощи компьютерных методов; пред- и постредактирование машинного перевода, совершенствование систем машинного перевода, использование специализированных баз данных в лингвистических исследованиях; сбор, подготовка, разметка, оценка, сохранение данных; поиск, запуск, настройка, готовых библиотек по АОЕЯ, дообучение больших языковых моделей, разработка методических учебных материалов для языковых программ с использованием подходов корпусной лингвистики, визуализация лингвистических данных.

Ключевые особенности:

В образовательной программе объединены два профессиональных ядра: прикладная лингвистика и информационные технологии, которые позволяют студенту сформировать ключевые компетенции в области цифровой лингвистики и быть востребованным на современном рынке труда.

  • Программа позволяет осуществлять индивидуализацию обучения в рамках двух основных образовательных треков. Трек «Машинный перевод» и «Лингвистические технологии в бизнесе».
  • Наличие проектно-исследовательского модуля, позволяющего студентам активно реализовать полученные знания на практике.
  • Программа интегрирована в инновационную научно-образовательную сферу «Цифровые гуманитарные науки» (Digital Humanities).

  • Главным внутриуниверситетским партнером является Лаборатория «Промышленные системы потоковой обработки данных»

  • Автоматическая обработка текста
  • Алгоритмы и структуры данных
  • Большие данные в гуманитарных науках
  • Дискурс-анализ лингвистических данных
  • Компьютерная лингвистика
  • Структурная лингвистика
  • Технологии автоматизированной обработки данных
  • Цифровые ресурсы в научном исследовании
  • Нейронный машинный перевод
  • Формальные модели в лингвистике
  • Проектная деятельность
  • Управление научным проектом
  • Специалист по автоматизации перевода и машинному переводу
  • Разработчик баз данных, онтологий, таксономий
  • Специалист по анализу данных в гуманитарной сфере (дата-сайентист)
  • Цифровой лингвист
  • Prompt-инженер
  • Тестировщик и разработчик программных продуктов
  • Разработчик цифровых образовательных ресурсов
  • Специалист по обработке естественного языка
  • Тренер систем ИИ
  • Преподаватель высшей школы и системы дополнительного образования
  • Компьютерная грамматическая семантика: алгоритмы вычисления категорий
  • Моделирование онтологии понятий для системы генерации текстов
  • Автоматизированная оценка тональности употребления феминитивов русского языка
  • Автоматическое извлечение терминологии из параллельного корпуса текстов (определенной предметной области)
  • Оптимизация процесса субтитрирования образовательных видео с помощью алгоритмов машинного перевода
  • Анализ пользовательских отзывов с помощью методов машинного обучения
  • Извлечение именованных сущностей из специальных параллельных корпусов в отраслевом машинном переводе
  • Оценка метрик автоматической оценки качества машинного перевода
  • Автоматическая рубрикация текстов методами тематического моделирования
  • Корпусные исследования типов дискурса
  • Исследование методов классификации на основе высокоуровневых лингвистических признаков
  • Разработка корпуса речевых ошибок русского языка на материале радио и телевизионных программ
  • Компьютерная обработка текстов на малоресурсном языке
  • Оценка эмоциональности синтезированного текста
  • Корпусно-ориентированный дискурсивный анализ ключевых слов, отражающих идентичность университета
  • Оптимизация методов атрибуции авторства при распознавании сгенерированных текстов ИИ
  • Автоматическое распознавание текстов XVIII в. на русском языке для лексикографической работы
  • Диагностика структурных и лексических паттернов в корпусе текстов русских песен
  • Создание глоссариев с помощью методов обработки естественного языка
  • Цифровые технологии в лингвистике: модель автоматической оценки речевого воздействия мультимодального электронного текста
  • Лексикографическая реконструкция топонимического ландшафта Западной Ингерманландии
  • Т-Сервис

    Компания Т-Сервис – единственный авторизованный реселлер решений Trados в России, а также на территории Армении, Азербайджана, Белоруссии, Казахстана, Киргизии, Молдавии, Туркменистана, Таджикистана, Узбекистана, Монголии. Принимает на практику студентов вузов, готовящих переводческие кадры, а также оказывает вузам помощь в передаче актуальных знаний учащимся и способствовать подготовке высококвалифицированных специалистов, востребованных современным рынком переводов. Специалисты компании привлекаются к чтению модулей профильных дисциплин программы магистратуры.

  • ООО "ПРОМТ"

    ООО "ПРОМТ" осуществляет деятельность в области информационных технологий. Основным видом деятельности ООО "ПРОМТ" является полный цикл  разработки лингвистических программных продуктов PROMT, начиная от их проектирования до оказания услуг по сопровождению (поддержке) и внедрению в информационные системы. PROMT предоставляет весь спектр решений для автоматического перевода. Компания принимает  на практику студентов в области цифровой и компьютерной лингвистики, специалисты компании привлекаются к чтению профильных дисциплин, руководству учебными проектами магистрантов. 

  • Институт лингвистических исследований РАН

    Институт лингвистических исследований РАН — одно из ведущих научно-исследовательских учреждений в области языкознания и одно из старейших в стране: история Института, основанного в сентябре 1921 г., насчитывает более ста лет. В ИЛИ РАН сформировались пять научных школ, история каждой из которых насчитывает несколько десятилетий: Санкт-Петербургская школа академической лексикографии, Санкт-Петербургская типологическая школа, Санкт-Петербургская школа функциональной грамматики, Санкт-Петербургская школа индоевропейского сравнительно-исторического языкознания, Санкт-Петербургская школа лингвистов-североведов. Важным направлением работы Института является экспертная и научно-просветительская деятельность. Специалисты института  привлекаются к чтению специальных дисциплин программы, руководству учебными  проектами, предлагают темы и осуществляют руководство проектно-технологической практикой  и выпускными квалификационными работами магистрантов.  

Коган Марина Самуиловна
Коган Марина Самуиловна
Руководитель программы
Дмитриев Александр Владиславович
Дмитриев Александр Владиславович
Научный руководитель программы