哈基米 API 站全模型分类及特点一览

为了方便大家在众多的模型列表中挑选最适合自己使用场景的模型，本文根据哈基米 API 站现有的主要模型矩阵进行了详细的分类与特点总结。

一、 Gemini 系列（谷歌旗下核心多模态模型）

Gemini 系列是本站的特色模型，具有强大的多模态（图像输入/解析）和角色扮演能力。根据不同的渠道资源，主要分为“满血系列”与“官逆系列”。

1. 核心系列前缀

[满血] 系列： 资源拉满无配额限制。根据字母变体不同，性格和智商有所差异。
- [满血D]： 智商顶配且稳定，适合复杂推理。
- [满血A]： 性格温柔，极度适配角色扮演（RP）场景。
- [满血C]： 破甲难度最高，逻辑严谨，通常拒绝违规请求。
- [满血F]： 顺从性极强（好破甲），但相对容易出现截断或空回。
[官逆] 系列： 逆向对接官方接口。性价比高且不易掉格式，非常适合手机端的角色扮演场景（性能略逊于满血）。

2. 常见版本后缀

preview（预览版）： 正式发布前的测试版本，可抢先体验新特性，但可能缺少文件上传等部分工具。
-128 / -512： 代表支持 128k 或 512k 的超长上下文窗口。尤其是 512k 版本，非常适合长篇文档解析和极长设定的小说创作。
thinking / maxthinking： 支持深度逻辑推导的“思考”版本。maxthinking 进一步强化了推理能力，适合数学题、代码调试等复杂逻辑任务。

二、 Claude 系列（Anthropic 旗下长文本专精模型）

Claude 系列以其极其优秀的文笔、细腻的情感刻画和出色的长文本逻辑著称，是角色扮演和内容创作的标杆。

1. 核心变体

Opus 系列： 旗舰顶配版本，推理能力强、输出质量极高，适合专业学术推导、大型文本和深度的剧情创作。 (注：部分带有 [特价] 前缀的版本大幅降低了调用成本，性价比极高)
Sonnet 系列： 在性能与成本之间取得完美平衡，是大多数人日常使用和角色扮演的绝对主力版本。带有 [官B] 前缀的版本为官方原生接口，稳定性有保障。
Haiku 系列： 轻量提速版，响应速度最快、调用成本最低，适合简单的闲聊对话或短文本生成等轻量化场景。

2. 常见版本后缀

日期后缀（如 -20251101）： 代表模型的具体迭代更新日期。越新的日期通常意味着修复了旧 Bug，并提升了整体的推理精度。
thinking： 深度推理版本。启用了类似 O1 的多步骤推导逻辑（Chain of Thought），输出内容的逻辑性和完整性远超基础版，专为极度复杂的任务设计。

三、 Grok 系列（马斯克旗下 xAI 实时专精模型）

Grok 系列以反叛精神、幽默感以及强大的实时搜索能力为卖点，并且基本没有安全审查（极易破甲），可以放心使用于各类无限制场景。

核心特点

基础版（grok-3 / grok-4）： 简洁实用，无额外功能增强，保留官方原生核心能力。响应速度极快，适合日常咨询与无障碍的 RP 对话。
Deepsearch（深度搜索版）： grok-4-deepsearch 集成了深度的联网搜索功能，能获取最新的时事、新闻、股票等数据信息，适合事实性查询和热点分析场景。
流式体验优异： 部分版本支持“真·开流输出”，内容实时生成显示，互动体验极其流畅。

四、 DeepSeek 系列（国内极高性价比开源模型）

DeepSeek 被誉为“国产之光”，以极低的价格提供了逼近国际顶尖大厂模型的逻辑推理能力。

核心变体

主版本（v3.1-terminus / v3.2）： 数字越大功能越新，通用能力强大。
R1 满血推理版（如 r1-0528）： 代表特定日期的迭代版（小鲸鱼）。大幅优化了响应速度和复杂的数理逻辑推理，在极度复杂的角色设定扮演中也有非常惊艳的表现。
OCR 专项版（deepseek-ocr）： 光学字符识别专项版。擅长图片中的文字提取、复杂排版的扫描件识别，解析精度显著高于普通的多模态大模型。

五、 Qwen 系列（通义千问专项优化模型）

Qwen 阿里系模型，这里的变体主要针对特定生产力场景进行了极致优化。

专项版本

qwen3-coder-480b： 4800亿参数的代码专项版。精通多语言编程、大型项目开发、代码调试与重构，是程序员的绝佳编程助手。
qwen3-embedding-8b： 专注文本向量化。输出的向量可直接用于语义检索、相似度计算、构建企业级知识库等底层基建。
qwen3-reranker-8b： 重排序优化版。对检索出的结果进行深度的语义层面重新排序，大幅提升 RAG（检索增强生成）搜索或问答系统的结果精准度。

六、其它特色小众模型

除了主流大厂模型，本站还提供了一些极具潜力的新兴模型供开发者和研究者使用。

MiniMax M2： 并非大家熟知的国产语音模型星野，而是稀宇科技推出的新一代开源大模型，专为智能体（Agent）和代码开发设计。它的核心优势是极快的推理速度（每秒 100 Tokens，是 Claude 3.5 Sonnet 的两倍），同时 API 成本仅为前者的 8%。它能够规划跨工具链的操作（如浏览网页、运行代码），非常适合轻量化自动化场景。
BGE-M3： 智源开源的下一代通用向量模型。支持 100+ 语言和 8192 长度文本输入。它通过 BERT 架构生成“学习型稀疏嵌入”，集成了稠密检索、稀疏检索和多向量检索三种功能。如果你在做多语言问答或 RAG 知识库，这个模型是不二之选。

感谢所有用户对哈基米 API 站的支持，祝大家使用愉快！ ⌯>𖥦<⌯ಣ

哈基米 API 站全模型分类及特点一览 ​

一、 Gemini 系列（谷歌旗下核心多模态模型） ​

1. 核心系列前缀 ​

2. 常见版本后缀 ​

二、 Claude 系列（Anthropic 旗下长文本专精模型） ​

1. 核心变体 ​

2. 常见版本后缀 ​

三、 Grok 系列（马斯克旗下 xAI 实时专精模型） ​

核心特点 ​

四、 DeepSeek 系列（国内极高性价比开源模型） ​

核心变体 ​

五、 Qwen 系列（通义千问专项优化模型） ​

专项版本 ​

六、 其它特色小众模型 ​

哈基米 API 站全模型分类及特点一览

一、 Gemini 系列（谷歌旗下核心多模态模型）

1. 核心系列前缀

2. 常见版本后缀

二、 Claude 系列（Anthropic 旗下长文本专精模型）

1. 核心变体

2. 常见版本后缀

三、 Grok 系列（马斯克旗下 xAI 实时专精模型）

核心特点

四、 DeepSeek 系列（国内极高性价比开源模型）

核心变体

五、 Qwen 系列（通义千问专项优化模型）

专项版本

六、其它特色小众模型