16 июля 2026

$ 77.96 € 88.91

Альянс в сфере ИИ выпустил новую версию бенчмарка больших языковых моделей MERA

Прослушать текст

искусственный интеллект /

/ 27.09.2024

Альянс в сфере искусственного интеллекта представил новую версию бенчмарка MERA: в нее вошли динамический лидерборд, обновленная кодовая база замеров, более совершенная система промптов и улучшенные датасеты, поддержка API, а также замеры десятков новых моделей, включая созданные OpenAI.

MERA (Multimodal Evaluation for Russian-language Architectures) – это крупнейший независимый открытый бенчмарк для оценки фундаментальных моделей русского языка, совместно разработанный на площадке Альянса в сфере искусственного интеллекта исследователями от индустрии – командами Сбера и MTS AI, а также академическими партнерами Skoltech AI и НИУ ВШЭ.

Обновленная версия бенчмарка включает в себя 15 основных задач, из которых строится рейтинг, и 8 открытых публичных датасетов.

С момента релиза первой версии бенчмарка им воспользовались десятки разработчиков моделей, отправивших свыше 1000 сабмитов. Совершенствование MERA стало возможно благодаря комментариям пользователей и обратной связи от участников NLP-сообщества. Дальнейшее развитие MERA предусматривает появление в нем задач для оценки распознавания изображений, аудио- и видеоматериалов.

Обсудить

Назад

Комментарии

Читайте также

В России создается Консультативный совет по этике в сфере ИИ с представителями традиционных религий

ИИ-разработчик Smart Engines подвел научные итоги 2025 года и обозначил ключевые достижения

В MAX можно будет за секунды сканировать печатные и рукописные документы

Сканеры Интек с ИИ Smart Engines внесены в реестр российской промышленной продукции Минпромторга РФ

В VK WorkSpace появился AI Ассистент — виртуальный помощник на базе генеративного ИИ

ИИ сгенерировал музыку для проекта по проверке знаний о Kubernetes

Альянс в сфере ИИ выпустил новую версию бенчмарка больших языковых моделей MERA

Последние новости

«Касса самообслуживания» для книг: как работают RFID-шкафы в ОМБ Перми

BI.ZONE: кибератаки на промышленность участились в 2 раза

Сбер2B запустила партнёрскую программу для логистического рынка

NDBC объединила управление проектной деятельностью и сервисом в PSA-системе на базе BPMSoft

ОМК автоматизировала контроль качества диагностики колесных пар грузовых железнодорожных вагонов

«Первый Бит» признали Центром компетенции по ЭДО в пяти городах России

В рубрике

Тульская Октава разрабатывает микрофонный модуль для спутниковой связи с предобработкой речи

В России создается Консультативный совет по этике в сфере ИИ с представителями традиционных религий

ИИ-разработчик Smart Engines подвел научные итоги 2025 года и обозначил ключевые достижения

В MAX можно будет за секунды сканировать печатные и рукописные документы

Сканеры Интек с ИИ Smart Engines внесены в реестр российской промышленной продукции Минпромторга РФ