Large language models: Section catalog — 大型语言模型：主题目录

From Systems analysis wiki

Jump to navigation Jump to search

Systems Analysis Wiki 中关于大型语言模型 (large language model, LLM)主题的系统方法文章目录。

网站：systems-analysis.ru

Large Language Models (LLM) - 大型语言模型 (LLM)

Catalog of Large Language Models (LLM) - 大型语言模型 (LLM) 目录

T5
LaMDA
PaLM
BERT
Chinchilla
Huawei PanGu
IBM Granite
BLOOM
Mixtral
DBRX
GPT
Claude
Gemma
Gemini
LLaMA
Mistral
DeepSeek
Grok
Qwen
Phi
Jais
Jamba
Cohere
Falcon
Perplexity
YandexGPT
Huggingface
OpenAI 大型语言模型
Google 大型语言模型
大型语言模型：模型目录

Prompt Engineering (LLM) - 提示词工程 (LLM)

AI agents (LLM) - AI 代理 (LLM)

AI 代理
代理工作流
多代理框架
LangChain
AutoGPT
多代理辩论

Evaluation and metric comparison (LLM) - 评估与指标比较 (LLM)

LLM 评估
LLM 质量指标
困惑度
BLEU
ROUGE
BERTScore
METEOR
MAUVE
LLM 即评判者

Benchmarks and datasets (LLM) - 基准与数据集 (LLM)

LLM 基准
MMLU benchmark
HellaSwag benchmark
HumanEval benchmark
TruthfulQA benchmark
MT-Bench benchmark
GLUE benchmark
SuperGLUE
Humanity's Last Exam
GSM8K (小学数学 8K)
WinoGrande benchmark
AgentHarm
SafetyBench
SWE-bench
BIG-bench
MATH benchmark
FLORES-200
RealToxicityPrompts
PromptRobust
BOLD
BBQ
LMArena
模型的 ELO 排名

Retrieved from "https://systems-analysis.ru/int/index.php?title=Large_language_models:_Section_catalog_—_大型语言模型：主题目录&oldid=9160"

Chinese