Grands modèles de langage: Catalogue de la section

From Systems analysis wiki
Jump to navigation Jump to search

Catalogue des articles du Systems Analysis Wiki sur le thème des Grands modèles de langage (large language model, LLM)

Site web : systems-analysis.ru

Grands modèles de langage (LLM)

Catalogue des grands modèles de langage (LLM)

Ingénierie des prompts (LLM)

  • Prompt
  • Ingénierie des prompts
  • Prompt et contexte
  • Techniques de base de l'ingénierie des prompts
  • Retrieval‑Augmented Generation (RAG)
  • Chain-of-Thought Prompting
  • Few-shot et Zero-shot
  • Role Prompting
  • Tree of Thoughts
  • Self‑refine prompting
  • Self-consistency prompting
  • Meta Prompting
  • Multi‑agent prompting
  • Prompt compression
  • Program of Thoughts Prompting
  • Generated Knowledge Prompting
  • Multimodal CoT Prompting
  • Graph-of-Thoughts
  • Chain-of-Verification
  • Toolformer
  • Least-to-Most Prompting
  • Automatic Prompt Engineer (APE)
  • ReAct Prompting
  • Function Calling
  • Patrons RAG
  • GraphRAG
  • MM-RAG (Multimodal RAG)
  • Hypothetical Document Expansion
  • Hybrid Retrieval
  • Packaging & Context Handling
  • Ingénierie des prompts. Catalogue de la section

Agents IA (LLM)

Évaluation et comparaison métrique (LLM)

Benchmarks et datasets (LLM)

  • Benchmarks des LLM
  • MMLU benchmark
  • HellaSwag benchmark
  • HumanEval benchmark
  • TruthfulQA benchmark
  • MT-Bench benchmark
  • GLUE benchmark
  • SuperGLUE
  • Humanity's Last Exam
  • GSM8K (Grade School Math 8K)
  • WinoGrande benchmark
  • AgentHarm
  • SafetyBench
  • SWE-bench
  • BIG-bench
  • MATH benchmark
  • FLORES‑200
  • RealToxicityPrompts
  • PromptRobust
  • BOLD
  • BBQ
  • LMArena
  • Classement ELO des modèles