Общество

Искусственный интеллект МТС заговорил на татарском языке

МТС, цифровая экосистема, представила разработанную MTS AI новую версию большой языковой модели Cotype Lite для работы с текстами на татарском языке. Она получила название Rehmet, что в переводе означает «спасибо»ПоделитьсяИскусственный интеллект МТС заговорил на татарском языке0

Искусственный интеллект МТС заговорил на татарском языке

Фото: Николай ОБЕРЕМЧЕНКО. Перейти в Фотобанк КП

MTS AI, один из ведущих центров компетенций по искусственному интеллекту в России, показал новую версию своей большой языковой модели Cotype на форуме Kazan Digital Week. Она способна обрабатывать документы объемом в пять листов A4, извлекать и суммаризировать данные за несколько секунд.

Cotype Rehmet может использоваться в архивах, библиотеках, в государственных и частных организациях — везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эта версия может устанавливаться в контуре организации, что позволяет исключить утечки информации.

«Создавая большую языковую модель на татарском, разработчики MTS AI преследовали несколько целей. Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России», — сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель Cotype Rehmet смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

По словам разработчиков, Cotype Rehmet входит в число лучших LLM в своем классе: она содержит восемь миллиардов параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 миллиардов параметров, а также большим контекстным окном до 32 тысяч токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России.

Источник: www.hab.kp.ru

Похожие записи

В Магаданской области необоснованно подорожали морковь и лук

На конференции Al Journey доклады на главной сцене будут переводиться на русский жестовый язык

В Хабаровске 8 марта пройдет без осадков при температуре от -4 до -6 градусов

Жители поселка в Хабаровском крае отравились некипяченой водой

Пока вы спали: новые купюры, клей в популярной колбасе, бомба в самолёте и Маск в ужасе

В Хабаровске пройдет выставка робототехники и тренировки операторов БпЛА

ВТБ предоставит «Амуррыбпрому» финансирование на строительство двух краболовов

Репетиции коллектива Хабаровского музыкального театра будут проходить в «Совкино»

В Хабаровске стартовал конкурс «Лучший предприниматель города»

Чему нас могут научить произведения искусства — например, живописи? Как музею стать понятным и доступным? Ответы на эти вопросы в студии телеканала «Хабаровск» дали эксперты Дальневосточной школы музе

Посетить культурные мероприятия и спектакли приглашают жителей края в рамках фестиваля «Амурская осень»

Дмитрий Демешин принял решение дополнительно повысить оклады работникам краевой бюджетной

Ваш комментарий

26 − = 24

* Используя эту форму, вы соглашаетесь с хранением и обработкой ваших данных этим веб-сайтом.

Новости от партнеров

Этот сайт использует файлы cookies и сервисы сбора технических данных посетителей. Ок Прочитать подробнее