大语言模型(Large Language Model,简称LLM)是一种基于深度学习的自然语言处理模型,能够理解和生成人类语言。这些模型通过海量文本数据训练,可以执行各种语言任务,如文本生成、问答、翻译等。
GPT(Generative Pre-trained Transformer)是目前最知名的大语言模型系列。
公司/机构 | 底座模型 | 应用平台 | 特点 | 开放程度 |
---|---|---|---|---|
OpenAI | GPT-4/3.5 | ChatGPT/API | 性能最强,多模态能力出色 | API付费使用 |
Anthropic | Claude 3系列 | Claude/API | 安全性高,推理能力强 | API付费使用 |
Gemini系列 | Bard/Gemini | 多模态,知识新鲜度高 | API付费使用 | |
Meta | LLaMA 2 | 开源社区 | 性能优秀,可本地部署 | 开源免费 |
百度 | 文心大模型 | 文心一言 | 中文优化,知识全面 | API付费使用 |
阿里云 | 通义千问 | 通义千问/API | 多场景优化,工具调用能力强 | API付费使用 |
讯飞 | 星火大模型 | 讯飞星火 | 语音交互优势,垂直领域优化 | API付费使用 |
智谱AI | ChatGLM系列 | 智谱清言 | 开源,轻量化部署 | 部分开源 |
Deepseek | Deepseek系列 | Deepseek Chat | 代码能力强,中英双语优化 | 部分开源 |