Skip to content

模型

Rifx.online 提供了一个多样化的模型库,涵盖了多种人工智能应用。我们整合了来自 OpenAI、Anthropic、Meta、Google 等顶级 AI 服务商的模型,通过统一的 API 接口提供访问。

主要模型类别

1. 文本处理模型(Text-to-Text)

目前提供的主要模型包括:

  • Ministral 8B

    • 特点:采用独特的交错滑动窗口注意力模式
    • 上下文:125K
    • 价格:$0.1/M 输入tokens,$0.1/M 输出tokens
    • 适用:边缘计算场景
  • Qwen2.5 系列

    • 7B 版本:适合一般应用场景
    • 72B 版本:提供更强大的编码和推理能力
    • 上下文:128K
    • 特点:相比 Qwen2 具有更丰富的知识储备
  • Claude 3.5 Sonnet

    • 提供方:Anthropic
    • 上下文:195.31K
    • 价格:$3/M 输入tokens,$15/M 输出tokens
    • 特长:代码编写、编辑和运行

2. 多模态模型(Text-Image-to-Text)

支持文本和图像输入的模型:

  • Meta Llama 3.2 Vision 系列

    • 11B 版本:适合一般视觉任务
    • 90B 版本:适合复杂视觉推理
    • 上下文:128K
    • 图像处理费用:$0.079-0.506/K image tokens
  • Qwen2-VL 72B

    • 特点:支持各种分辨率和比例的图像理解
    • 上下文:32K
    • 价格:$0.4/M tokens(输入/输出),$0.578/K image tokens

3. 专业模型

  • OpenAI o1 系列
    • mini 版本:$3/M 输入,$12/M 输出
    • preview 版本:$15/M 输入,$60/M 输出
    • 特点:专注于数学、科学、编程等 STEM 领域

模型选择指南

选择模型时需考虑以下因素:

1. 性能需求

  • 响应速度:如需快速响应,可选择较小参数量的模型如 Llama 3.2 1B
  • 准确度:对准确度要求高的场景,建议选择大参数模型如 Qwen2.5 72B

2. 成本考虑

  • 低成本方案
    • Llama 3.2 1B:$0.01/M 输入,$0.02/M 输出
    • Qwen2 7B:$0.054/M tokens
  • 高性能方案
    • Claude 3.5 Sonnet
    • OpenAI o1 系列

3. 特殊功能需求

  • 长文本处理:选择具有较大上下文窗口的模型
  • 图像处理:使用支持多模态的模型如 Llama Vision 或 Qwen2-VL
  • 专业领域:根据具体场景选择专门优化的模型

更多详细信息请访问 Rifx.online Models