Large language models: Section catalog — 大型语言模型:主题目录

From Systems analysis wiki
Jump to navigation Jump to search

Systems Analysis Wiki 中关于大型语言模型 (large language model, LLM)主题的系统方法文章目录。

网站:systems-analysis.ru

Large Language Models (LLM) - 大型语言模型 (LLM)

  • 大型语言模型
  • LLM 理论基础
  • LLM 架构
  • Transformer 架构
  • 编码器
  • 解码器
  • 仅编码器
  • 仅解码器
  • 编码器-解码器
  • 令牌化
  • 令牌
  • 嵌入
  • 上下文窗口
  • 大型语言模型的训练
  • 预训练
  • 微调
  • 情境学习
  • Top-p
  • Top-k
  • 温度 (LLM)
  • LLM 的幻觉与错误回答
  • 数据失真与偏见
  • 上下文遗忘
  • 生成偏见
  • 混合专家模型 (MoE)
  • 减少 LLM 错误
  • 优化 LLM 使用成本
  • 开放权重与封闭权重模型
  • 宪法 AI
  • 可解释 AI
  • RLHF
  • 直接偏好优化
  • 低秩自适应 (LoRA)
  • PEFT
  • 向量数据库
  • 多模态 LLM
  • 越狱
  • FlashAttention
  • FlashAttention-2
  • FlashAttention-3
  • 停止序列
  • 合成数据生成
  • 多模态推理
  • 随机鹦鹉

Catalog of Large Language Models (LLM) - 大型语言模型 (LLM) 目录

  • T5
  • LaMDA
  • PaLM
  • BERT
  • Chinchilla
  • Huawei PanGu
  • IBM Granite
  • BLOOM
  • Mixtral
  • DBRX
  • GPT
  • Claude
  • Gemma
  • Gemini
  • LLaMA
  • Mistral
  • DeepSeek
  • Grok
  • Qwen
  • Phi
  • Jais
  • Jamba
  • Cohere
  • Falcon
  • Perplexity
  • YandexGPT
  • Huggingface
  • OpenAI 大型语言模型
  • Google 大型语言模型
  • 大型语言模型:模型目录

Prompt Engineering (LLM) - 提示词工程 (LLM)

  • 提示词
  • 提示词工程
  • 提示词与上下文
  • 提示词工程基本技巧
  • 检索增强生成 (RAG)
  • 思维链提示
  • 少样本与零样本
  • 角色提示
  • 思维树 (ToT)
  • 自我修正提示
  • 自我一致性提示
  • 元提示
  • 多代理提示
  • 提示词压缩
  • 程序思维提示
  • 生成知识提示
  • 多模态思维链提示
  • 思维图
  • 验证链
  • Toolformer
  • 由简到繁提示
  • 自动提示工程师 (APE)
  • ReAct 提示
  • 函数调用
  • RAG 模式
  • GraphRAG
  • 多模态 RAG (MM-RAG)
  • 假设性文档扩展
  • 混合检索
  • 打包与上下文处理
  • 提示词工程:主题目录

AI agents (LLM) - AI 代理 (LLM)

  • AI 代理
  • 代理工作流
  • 多代理框架
  • LangChain
  • AutoGPT
  • 多代理辩论

Evaluation and metric comparison (LLM) - 评估与指标比较 (LLM)

  • LLM 评估
  • LLM 质量指标
  • 困惑度
  • BLEU
  • ROUGE
  • BERTScore
  • METEOR
  • MAUVE
  • LLM 即评判者

Benchmarks and datasets (LLM) - 基准与数据集 (LLM)

  • LLM 基准
  • MMLU benchmark
  • HellaSwag benchmark
  • HumanEval benchmark
  • TruthfulQA benchmark
  • MT-Bench benchmark
  • GLUE benchmark
  • SuperGLUE
  • Humanity's Last Exam
  • GSM8K (小学数学 8K)
  • WinoGrande benchmark
  • AgentHarm
  • SafetyBench
  • SWE-bench
  • BIG-bench
  • MATH benchmark
  • FLORES-200
  • RealToxicityPrompts
  • PromptRobust
  • BOLD
  • BBQ
  • LMArena
  • 模型的 ELO 排名