Skip to content

模型

Rifx.online 提供了一个多样化的模型库，涵盖了多种人工智能应用。我们整合了来自 OpenAI、Anthropic、Meta、Google 等顶级 AI 服务商的模型，通过统一的 API 接口提供访问。

主要模型类别

1. 文本处理模型（Text-to-Text）

目前提供的主要模型包括：

Ministral 8B
- 特点：采用独特的交错滑动窗口注意力模式
- 上下文：125K
- 价格：$0.1/M 输入tokens，$0.1/M 输出tokens
- 适用：边缘计算场景
Qwen2.5 系列
- 7B 版本：适合一般应用场景
- 72B 版本：提供更强大的编码和推理能力
- 上下文：128K
- 特点：相比 Qwen2 具有更丰富的知识储备
Claude 3.5 Sonnet
- 提供方：Anthropic
- 上下文：195.31K
- 价格：$3/M 输入tokens，$15/M 输出tokens
- 特长：代码编写、编辑和运行

2. 多模态模型（Text-Image-to-Text）

支持文本和图像输入的模型：

Meta Llama 3.2 Vision 系列
- 11B 版本：适合一般视觉任务
- 90B 版本：适合复杂视觉推理
- 上下文：128K
- 图像处理费用：$0.079-0.506/K image tokens
Qwen2-VL 72B
- 特点：支持各种分辨率和比例的图像理解
- 上下文：32K
- 价格：$0.4/M tokens（输入/输出），$0.578/K image tokens

3. 专业模型

OpenAI o1 系列
- mini 版本：$3/M 输入，$12/M 输出
- preview 版本：$15/M 输入，$60/M 输出
- 特点：专注于数学、科学、编程等 STEM 领域

模型选择指南

选择模型时需考虑以下因素：

1. 性能需求

响应速度：如需快速响应，可选择较小参数量的模型如 Llama 3.2 1B
准确度：对准确度要求高的场景，建议选择大参数模型如 Qwen2.5 72B

2. 成本考虑

低成本方案：
- Llama 3.2 1B：$0.01/M 输入，$0.02/M 输出
- Qwen2 7B：$0.054/M tokens
高性能方案：
- Claude 3.5 Sonnet
- OpenAI o1 系列

3. 特殊功能需求

长文本处理：选择具有较大上下文窗口的模型
图像处理：使用支持多模态的模型如 Llama Vision 或 Qwen2-VL
专业领域：根据具体场景选择专门优化的模型

更多详细信息请访问 Rifx.online Models。