Справка
Категория
:
Бенчмарки LLM
Материал из Systems analysis wiki
Перейти к навигации
Перейти к поиску
Бенчмарки LLM
Страницы в категории «Бенчмарки LLM»
Показаны 24 страницы из 24, находящихся в данной категории.
A
AgentHarm
B
BBQ
BIG-bench
BOLD
E
ELO‑ранжирование моделей
F
FLORES‑200
G
GLUE benchmark
GSM8K
H
HellaSwag benchmark
HumanEval benchmark
Humanity's Last Exam
L
LMArena
M
MATH benchmark
MMLU benchmark
MT-Bench benchmark
P
PromptRobust
R
RealToxicityPrompts
S
SafetyBench
SuperGLUE
SWE-bench
T
TruthfulQA benchmark
W
WinoGrande benchmark
Б
Бенчмарки LLM
О
Оценка LLM
Категория
:
Большие языковые модели
Навигация
Персональные инструменты
Войти
Пространства имён
Категория
Обсуждение
русский
Просмотры
Читать
Просмотр кода
Ещё
Поиск
Навигация
Заглавная страница
Случайная страница
Ссылки
Systems-analysis.ru
English version
Telegram
YouTube
Инструменты
Служебные страницы
Версия для печати
Постоянная ссылка
Сведения о странице