deepseek-v3--火山方舟大模型服务平台-火山引擎

文档中心

导航

deepseek-v3

最近更新时间：2025.03.28 11:27:29首次发布时间：2025.03.26 23:10:05

智力程度

中等

速度

中等

价格（百万token）

2元[输入]，8元[输出]

输入

文本

输出

文本

DeepSeek-V3 是一款由深度求索公司自研的MoE模型。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

最大上下文长度：128k
最大思维链内容长度：不涉及
可配置最大输出长度：16k
默认最大输出长度：4k

模型价格

元/百万 token

输入
2.00

输出
8.00

缓存命中
0.40

缓存存储[每小时]
0.017

输入[批量]
1.00

输出[批量]
4.00

其中使用前缀缓存会产生缓存命中、缓存存储计费；批量推理产生输入[批量]、输出[批量]费用。具体请参阅模型服务计费。

deepseek-v3

速率限制通过对给定时间段内的请求或令牌使用量设置特定上限来确保公平可靠地访问 API。

TPM：5,000,000

RPM：3,0000

模型调用教程

供您了解如何调用该模型，包括参数如何配置以及一些典型使用示例代码，您可以基于此进行扩展。

模型调用API参数的说明

供您查阅API请求以及返回参数取值范围、默认值、示例等信息。

deepseek-v3-250324 模型 temperature 字段对齐DeepSeek官方的处理逻辑。

举例：您在请求中设置temperature为1，则在模型侧会映射 temperature 值为0.3。