Perplexity AI — Perplexity AI(搜索问答产品)
Perplexity AI 是一家美国初创公司,也是一款同名的对话式搜索引擎 (conversational search engine),它利用人工智能为用户的查询提供直接答案,并附上信息来源[1]。该公司于2022年由来自OpenAI、Meta、Google、DeepMind和Databricks的专家团队创立[2]。
该平台结合了自有的大型语言模型 (LLM) 和对其他公司领先模型的访问权限,从而能够优化答案的速度、准确性和成本。Perplexity的核心技术是先进的检索增强生成 (Retrieval-Augmented Generation, RAG)系统,该系统利用其自有的搜索基础设施中的最新信息来丰富LLM的回答[3]。
历史与创始人
Perplexity AI 公司于2022年由四位专家创立:
- Aravind Srinivas (首席执行官 CEO) — 曾任 OpenAI、Google Brain 和 DeepMind 的研究员[4]。
- Denis Yarats (首席技术官 CTO) — 曾任 Meta AI 的研究科学家。
- Johnny Ho (首席战略官 CSO) — 曾任 Quora 工程师。
- Andy Konwinski — Databricks 联合创始人[2]。
最初,该项目被设想为用于数据分析的 B2B 服务,但在2022年10月,团队基于 Bing 和 GPT-3 开发了一个搜索引擎原型,这决定了公司的未来发展方向[5]。
Perplexity AI 吸引了包括 Nvidia、软银 (SoftBank) 和亚马逊创始人杰夫·贝索斯 (Jeff Bezos) 在内的主要投资者的巨额投资。到2025年初,公司估值达到140亿美元[6],月活跃用户超过1500万[7]。
技术架构
Retrieval-Augmented Generation (RAG) - 检索增强生成
Perplexity 的基础是 RAG 技术,它能克服传统 LLM 的局限性,例如知识陈旧和“幻觉”。其工作流程包括以下几个阶段[8]:
- 分析并重构用户查询,以实现最佳搜索。
- 使用自有的搜索基础设施(网络爬虫和排名系统)进行信息检索,该系统优先考虑权威和非SEO来源[7]。
- 从找到的网页中提取最相关的片段(“snippets”)。
- 利用 LLM 基于这些片段生成连贯、准确的回答。
- 生成答案时附带引文和原始来源链接。
多模型策略
Perplexity 采用混合方法,结合自有模型和第三方模型,以实现速度、准确性和成本之间的平衡[9]。
- 免费版中,为了快速响应,通常使用 Claude 3 Haiku。
- 付费的 Pro 版中,可使用更强大的模型,如 Claude 3.5 Sonnet 和 GPT-4o。
拥有 Perplexity Pro 订阅的用户可以手动从多种模型中进行选择,包括[10]:
- OpenAI: GPT-4o, GPT-4 Turbo
- Anthropic: Claude 3.5 Sonnet, Claude 3 Opus, Claude 3 Haiku
- Google: Gemini 2.5 Pro
- Meta: Llama 3
- Mistral AI: Mistral Large
- xAI: Grok-3 Beta
- Perplexity 自有模型。
Perplexity 的自有模型
该公司开发了专为搜索任务和处理互联网最新信息而优化的自有模型。
PPLX 系列(早期模型)
Perplexity 首批通过 API 提供的自有模型是 pplx-7b-online 和 pplx-70b-online,于2023年12月推出[11]。它们分别基于微调版的 Mistral 7B 和 Llama 2 70B,专注于处理在线数据[12]。
Sonar 系列(当前一代)
Sonar 是旗舰模型系列,基于 Meta 的 Llama 3.1 70B 构建,但经过了额外的微调,以提高搜索模式下答案的事实准确性和可读性[13]。
Sonar 的主要特点:
- 高速度: 得益于与 Cerebras 的合作及其专用的推理基础设施,Sonar 的生成速度高达每秒 1200 个词元,比 Gemini 2.0 Flash 快近10倍[14]。
- 推测解码技术: 为了进一步加速生成,使用了一个大小为1B的自有“草稿模型”,它允许主模型在一次传递中生成多个词元[15]。
- 高性能: 在 LM Arena 的 Search Arena 评估中,Sonar-Reasoning-Pro 模型排名第一,在统计上与 Gemini-2.5-Pro-Grounding 持平[16]。
API and Enterprise Solutions - API 与企业解决方案
Perplexity 通过 Sonar API 和 Sonar Pro API 为开发者和企业客户提供对其模型的访问。这些 API 针对速度和易用性进行了优化,包括引用功能和自定义搜索源的选项。Perplexity 的解决方案被用于各行各业,以创建原生搜索引擎和自动化研究任务[17]。
对比分析与用户体验
Perplexity 的性能因任务类型而异。
- 在需要基于最新数据进行高事实准确性判断的任务中(例如放射学分析),Perplexity 表现出最高的准确率 (0.83),优于 Claude、Bing 和 ChatGPT[18]。
- 在涉及罕见或高度专业化知识的任务中(例如罕见疾病),Perplexity 可能会输给知识库更广泛的模型,如 ChatGPT 和 Gemini[19]。
一项可用性研究 (SUS) 表明,尽管 Google 和 Perplexity 两个平台都可接受,但 Google 的得分 (82.29) 高于 Perplexity (73.98)。这归因于用户对 Google 界面的熟悉,以及 Perplexity 提供了创新但不太熟悉的功能,导致学习曲线更陡峭[20]。
链接
参考文献
- Chen, C.; et al. (2023). Accelerating Large Language Model Decoding with Speculative Sampling. arXiv:2302.01318.
- Zhang, J.; et al. (2023). Draft & Verify: Lossless Large Language Model Acceleration via Self‑Speculative Decoding. arXiv:2309.08168.
- Chen, H.; et al. (2024). Retrieval‑Augmented Generation for Large Language Models: A Survey. arXiv:2312.10997.
- Soudani, H.; et al. (2024). Fine‑Tuning vs. Retrieval‑Augmented Generation for Less‑Popular Knowledge. arXiv:2403.01432.
- Chen, Y.; et al. (2024). Evaluation of Retrieval‑Augmented Generation: A Survey. arXiv:2405.07437.
- Hsieh, C.‑P.; et al. (2024). RULER: What's the Real Context Size of Your Long‑Context Language Models?. arXiv:2404.06654.
- Arena Team (2025). Search Arena: Analyzing Search‑Augmented Large Language Models. arXiv:2506.05334.
- Zhu, W.; et al. (2025). PSC: Extending Context Windows via Phase Shift Calibration. arXiv:2505.12423.
- Yu, L.; et al. (2025). Synergizing RAG and Reasoning: A Systematic Review. arXiv:2504.15909.
- Chen, X.; et al. (2025). Universal Embeddings for Multimodal Multilingual Retrieval. arXiv:2506.18902.
注释
- ↑ “Perplexity.ai”. 维基百科,自由的百科全书. [1]
- ↑ 2.0 2.1 “Perplexity AI — 谷歌杀手还是昙花一现”. RBC Trends. [2]
- ↑ “An Introduction to RAG Models”. Perplexity AI. [3]
- ↑ “Aravind Srinivas”. In Wikipedia. [4]
- ↑ Belousova, Anastasia. “白俄罗斯人如何与合作伙伴共同打造出全球最昂贵的初创公司之一Perplexity”. Forbes.ru. [5]
- ↑ “初创公司Perplexity AI估值达140亿美元”. Ваш голос. [6]
- ↑ 7.0 7.1 “基于AI的搜索引擎Perplexity实现爆炸性增长,准备与谷歌竞争”. 3DNews. [7]
- ↑ “Perplexity:这是什么神经网络,如何工作以及为何需要它”. TimeWeb.Cloud. [8]
- ↑ “Perplexity与Claude AI:提供精准答案的引擎”. Кедр.pro. [9]
- ↑ “What advanced AI models are included in a Perplexity Pro subscription?”. Perplexity Help Center. [10]
- ↑ “Perplexity Unveils Two New Online LLM Models: pplx-7b-online and pplx-70b-online”. MarkTechPost. [11]
- ↑ “Introducing PPLX Online LLMs”. Perplexity Blog. [12]
- ↑ “Meet a new era of Perplexity Sonar”. Perplexity Blog. [13]
- ↑ “Cerebras Powers Perplexity Sonar with Industry's Fastest AI Inference”. Cerebras Press Release. [14]
- ↑ “Accelerating Sonar through Speculation”. Perplexity Blog. [15]
- ↑ “Perplexity Sonar Dominates New Search Arena”. Perplexity Blog. [16]
- ↑ “Introducing the Sonar Pro API”. Perplexity Blog. [17]
- ↑ “Comparative Analysis of Large Language Models for Question Answering in Radiology”. Thieme Connect. [18]
- ↑ “A Comparative Study of AI Chatbots in Answering Questions on Rare Diseases”. MDPI. [19]
- ↑ “Usability and User Satisfaction of Google Search and Perplexity AI”. IEEE Xplore. [20]
Category:AI tools