模型服务计费
模型价格
文本生成
按量后付费
模型名称 | 版本名称 | 服务内容 | 子项 | 在线推理 | 批量推理 | 单位 |
---|---|---|---|---|---|---|
ERNIE 4.5 Turbo | ERNIE-4.5-Turbo-128K-Preview ERNIE-4.5-Turbo-128K ERNIE-4.5-Turbo-32K |
推理服务 | 输入 | 0.0008 | 0.00032 | 元/千tokens |
命中缓存 | 0.0002 | -- | 元/千tokens | |||
输出 | 0.0032 | 0.00128 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
ERNIE 4.5 Turbo VL | ERNIE-4.5-Turbo-VL-Preview ERNIE-4.5-Turbo-VL-32K ERNIE-4.5-Turbo-VL-32K-Preview |
推理服务 | 输入 | 0.003 | 0.0012 | 元/千tokens | 命中缓存 | 0.00075 | -- | 元/千tokens |
输出 | 0.009 | 0.0036 | 元/千tokens | |||
ERNIE 4.5 | ERNIE-4.5-8K | 推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
输出 | 0.016 | 0.0064 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
ERNIE 4.5 | ERNIE-4.5-VL-28B-A3B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 |
0.004 | 0.0016 | 元/千tokens | |||
ERNIE 4.5 | ERNIE-4.5-0.3B | 推理服务 | 输入 | 0.0001 | 0.00004 | 元/千tokens |
输出 | 0.0004 | 0.00016 | 元/千tokens | |||
ERNIE 4.5 | ERNIE-4.5-21B-A3B | 推理服务 | 输入 | 0.0005 | 0.0002 | 元/千tokens |
输出 | 0.002 | 0.0008 | 元/千tokens | |||
ERNIE 4.0 Turbo | ERNIE-4.0-Turbo-8K ERNIE-4.0-Turbo-128K ERNIE-4.0-Turbo-8K-Preview |
推理服务 | 输入 | 0.003 | 0.0012 | 元/千tokens |
输出 | 0.009 | 0.0036 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
ERNIE 4.0 | ERNIE-4.0-8K ERNIE-4.0-8K-Preview |
推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
输出 | 0.016 | 0.0064 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
ERNIE 3.5 | ERNIE-3.5-8K ERNIE-3.5-128K ERNIE-3.5-8K-Preview |
推理服务 | 输入 | 0.0008 | 0.00032 | 元/千tokens |
输出 | 0.002 | 0.0008 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
DeepSeek-V3 | DeepSeek-V3 | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
Kimi-K2-Instruct | Kimi-K2-Instruct | 推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
输出 | 0.016 | 0.0064 | 元/千tokens | |||
ERNIE Speed Pro | ERNIE-Speed-Pro-128K | 推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.0006 | 0.00024 | 元/千tokens | |||
ERNIE Lite Pro | ERNIE-Lite-Pro-128K | 推理服务 | 输入 | 0.0002 | 0.00008 | 元/千tokens |
输出 | 0.0004 | 0.00016 | 元/千tokens | |||
ERNIE Speed | ernie-speed-128k ernie-speed-8k |
推理服务 | 输入 | 0 | 0.00012 | 元/千tokens |
输出 | 0 | 0.00024 | 元/千tokens | |||
ERNIE Lite | ernie-lite-8k | 推理服务 | 输入 | 0 | 0.0012 | 元/千tokens |
输出 | 0 | 0.0024 | 元/千tokens | |||
ERNIE Tiny | ernie-tiny-8k | 推理服务 | 输入 | 0 | 0.00008 | 元/千tokens |
输出 | 0 | 0.00016 | 元/千tokens | |||
ERNIE Character | ernie-char-8k ernie-char-fiction-8k ernie-char-fiction-8k-preview |
推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.0006 | 0.00024 | 元/千tokens | |||
ERNIE Novel | ernie-novel-8k | 推理服务 | 输入 | 0.04 | -- | 元/千tokens |
输出 | 0.12 | -- | 元/千tokens | |||
Qianfan-8B | Qianfan-8B | 推理服务 | 输入 | 0.0005 | 0.0008 | 元/千tokens |
输出 | 0.001 | 0.0008 | 元/千tokens | |||
Qianfan-70B | Qianfan-70B | 推理服务 | 输入 | 0.0008 | 0.0025 | 元/千tokens |
输出 | 0.0032 | 0.0025 | 元/千tokens | |||
Qianfan-Agent | Qianfan-Agent-Intent-32K | 推理服务 | 输入 | 0.0004 | - | 元/千tokens |
输出 | 0.0012 | - | 元/千tokens | |||
Qianfan-Sug | Qianfan-Sug | 推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.0006 | 0.00024 | 元/千tokens | |||
Qianfan-Check-VL | qianfan-check-vl | 推理服务 | 输入 | 0.00125 | 0.0005 | 元/千tokens |
输出 | 0.00375 | 0.0015 | 元/千tokens | |||
Qwen3 | Qwen3-235B-A22B-Instruct-2507 | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
Qwen3 | Qwen3-235B-A22B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
Qwen3 | Qwen3-30B-A3B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.00075 | 0.0003 | 元/千tokens |
输出 | 0.003 | 0.0012 | 元/千tokens | |||
Qwen3 | Qwen3-32B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
Qwen3 | Qwen3-14B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.0016 | 元/千tokens | |||
Qwen3 | Qwen3-8B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0005 | 0.0002 | 元/千tokens |
输出 | 0.002 | 0.0008 | 元/千tokens | |||
Qwen3 | Qwen3-4B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.0012 | 0.00048 | 元/千tokens | |||
Qwen3 | Qwen3-1.7B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.0012 | 0.00048 | 元/千tokens | |||
Qwen3 | Qwen3-0.6B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.0012 | 0.00048 | 元/千tokens | |||
Qwen2.5 | Qwen2.5-7B-Instruct | 推理服务 | 输入 | 0.0005 | 0.0002 | 元/千tokens |
输出 | 0.001 | 0.0004 | 元/千tokens | |||
GLM-4-32B-0414 | GLM-4-32B-0414 | 推理服务 | 输入 | 0.001 | 0.0018 | 元/千tokens |
输出 | 0.004 | 0.0018 | 元/千tokens | |||
Llama-4-Maverick | Llama-4-Maverick-17B-128E-Instruct | 推理服务 | 输入 | 0.007 | 0.0028 | 元/千tokens |
输出 | 0.021 | 0.0084 | 元/千tokens | |||
Llama-4-Scout | Llama-4-Scout-17B-16E-Instruct | 推理服务 | 输入 | 0.006 | 0.0024 | 元/千tokens |
输出 | 0.018 | 0.0072 | 元/千tokens | |||
Meta-Llama-3-8B | Meta-Llama-3-8B | 推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
Meta-Llama-3-70B | Meta-Llama-3-70B | 推理服务 | 输入 | 0.035 | 0.0025 | 元/千tokens |
输出 | 0.035 | 0.0025 | 元/千tokens | |||
Qianfan-Chinese-Llama-2-13B | Qianfan-Chinese-Llama-2-13B | 推理服务 | 输入 | 0.006 | 0.0018 | 元/千tokens |
输出 | 0.006 | 0.0018 | 元/千tokens | |||
Qianfan-FuncCaller | Qianfan-FuncCaller | 推理服务 | 输入 | 0.0008 | 0.00032 | 元/千tokens |
输出 | 0.0032 | 0.00128 | 元/千tokens |
按量包付费
注:文档中的商品价格可能存在延迟,最终价格以订单页为准。
量包名称 | 量包额度(Tokens) | 服务速率限制 | 有效期 | 原价(元) | 折扣率 | 折后价(元) |
---|---|---|---|---|---|---|
ERNIE-X1-32K-Preview 系列预置服务共享量包 |
1亿 | TPM = 500K RPM = 1,500 |
6个月 | 350 | 90% | 315 |
5亿 | TPM = 800K RPM = 1,500 |
6个月 | 1,750 | 85% | 1,487.5 | |
10亿 | TPM = 1,200K RPM = 1,500 |
6个月 | 3,500 | 80% | 2,800 | |
ERNIE-4.0-8K 系列预置服务共享量包 |
1000万 | TPM = 800K RPM = 10K |
6个月 | 70 | 90% | 63 |
5000万 | TPM = 800K RPM = 10K |
6个月 | 350 | 80% | 280 | |
1亿 | TPM =1040K RPM = 10K |
12个月 | 700 | 80% | 560 | |
5亿 | TPM = 5200K RPM = 10K |
12个月 | 3,500 | 75% | 2,625 | |
10亿 | TPM = 10400K RPM = 10K |
12个月 | 7,000 | 70% | 4,900 | |
ERNIE-3.5-8K 系列预置服务共享量包 |
5,000万 | TPM = 800K RPM = 10K |
6个月 | 55 | 92% | 50.60 |
1亿 | TPM = 800K RPM = 10K |
12个月 | 110 | 90% | 99 | |
5亿 | TPM = 800K RPM = 10K |
12个月 | 550 | 80% | 440 | |
10亿 | TPM =1040K RPM = 10K |
12个月 | 1,100 | 80% | 880 | |
50亿 | TPM = 5200K RPM = 10K |
12个月 | 5,500 | 75% | 4,125 | |
100亿 | TPM =10400K RPM = 10K |
12个月 | 11,000 | 70% | 7,700 | |
ERNIE-4.0-Turbo-8K 系列预置服务共享量包 |
1,000万 | TPM = 800K RPM = 10K |
6个月 | 45 | 90% | 40.5 |
5,000万 | TPM = 800K RPM = 10K |
6个月 | 225 | 80% | 180 | |
1亿 | TPM =1040K RPM = 10K |
12个月 | 450 | 80% | 360 | |
5亿 | TPM = 5200K RPM = 10K |
12个月 | 2,250 | 75% | 1,687.5 | |
10亿 | TPM =10400K RPM = 10K |
12个月 | 4,500 | 70% | 3,150 | |
ERNIE-3.5-128K 系列预置服务共享量包 |
1亿 | TPM = 400K RPM = 5K |
12个月 | 110 | 90% | 99 |
5亿 | TPM = 400K RPM = 5K |
12个月 | 550 | 80% | 440 | |
10亿 | TPM = 800K RPM = 5K |
12个月 | 1,100 | 80% | 880 | |
50亿 | TPM = 4000K RPM = 5K |
12个月 | 5,500 | 75% | 4,125 | |
ERNIE-Lite-Pro-128K 系列预置服务共享量包 |
1亿 | TPM = 800K RPM = 10K |
12个月 | 25 | 90% | 22.5 |
10亿 | TPM = 800K RPM = 10K |
12个月 | 250 | 85% | 212.50 | |
50亿 | TPM = 800K RPM = 10K |
12个月 | 1,250 | 80% | 1,000 | |
ERNIE-Speed-Pro-128K 系列预置服务共享量包 |
1亿 | TPM = 800K RPM = 10K |
12个月 | 37.5 | 90% | 33.75 |
10亿 | TPM = 800K RPM = 10K |
12个月 | 375 | 85% | 318.75 | |
50亿 | TPM = 800K RPM = 10K |
12个月 | 1,875 | 80% | 1,500 | |
ERNIE-4.0-Turbo-128K 系列预置服务共享量包 |
1亿 | TPM = 400K RPM = 5K |
12个月 | 450 | 90% | 405 |
5亿 | TPM = 400K RPM = 5K |
12个月 | 2,250 | 80% | 1,800 | |
10亿 | TPM = 800K RPM = 5K |
12个月 | 3,600 | 80% | 2,880 | |
ERNIE-4.5-Turbo-32K 系列预置服务共享量包 |
1亿 | TPM = 400K RPM = 5K |
6个月 | 140 | 90% | 126 |
5亿 | TPM = 600K RPM = 5K |
6个月 | 700 | 85% | 595 | |
10亿 | TPM = 1000K RPM = 5K |
6个月 | 1,400 | 80% | 1,120 | |
ERNIE-4.5-Turbo-128K 系列预置服务共享量包 |
1亿 | TPM = 400K RPM = 5K |
6个月 | 140 | 90% | 126 |
5亿 | TPM = 600K RPM = 5K |
6个月 | 700 | 85% | 595 | |
10亿 | TPM = 1000K RPM = 5K |
6个月 | 1,400 | 80% | 1,120 | |
ERNIE-4.5-Turbo-VL-32K 系列预置服务共享量包 |
1亿 | TPM = 200K RPM = 1K |
6个月 | 450 | 90% | 405 |
5亿 | TPM = 300K RPM = 1K |
6个月 | 2,250 | 85% | 1,912.5 | |
10亿 | TPM = 500K RPM = 1K |
6个月 | 4,500 | 80% | 3,600 |
按TPM付费
注:文档中的商品价格可能存在延迟,最终价格以订单页为准。
模型名称 | 版本名称 | 单位规格 | 预付费(元/个/月) | 后付费(元/个/小时) | ||
---|---|---|---|---|---|---|
原价 | 活动价 | 原价 | 活动价 | |||
ERNIE 4.5 | ERNIE-4.5-8K-Preview | TPM = 10000 RPM = 33 |
3024 | 3024 | 6.5 | 6.5 |
ERNIE 4.0 | ERNIE-4.0-8K | TPM = 10000 RPM = 33 |
27000 | 1512 | 55 | 3.2 |
ERNIE-4.0-8K-Preview | TPM = 10000 RPM = 33 |
27000 | 1512 | 55 | 3.2 | |
ERNIE 4.0 Turbo | ERNIE-4.0-Turbo-8K | TPM = 10000 RPM = 33 |
12000 | 972 | 25 | 2 |
ERNIE-4.0-Turbo-128K | TPM = 10000 RPM = 33 |
12000 | 972 | 25 | 2 | |
ERNIE-4.0-Turbo-8K-Preview | TPM = 10000 RPM = 33 |
12000 | 972 | 25 | 2 | |
ERNIE-4.0-Turbo-8K-0628 | TPM = 10000 RPM = 33 |
12000 | 972 | 25 | 2 | |
ERNIE-4.0-Turbo-8K-latest | TPM = 10000 RPM = 33 |
12000 | 972 | 25 | 2 | |
ERNIE 3.5 | ERNIE-3.5-8K | TPM = 10000 RPM = 33 |
4250 | 237.6 | 10 | 0.5 |
ERNIE-3.5-128K | TPM = 10000 RPM = 2 |
17000 | 237.6 | 40 | 0.5 | |
ERNIE-3.5-8K-Preview | TPM = 10000 RPM = 33 |
4250 | 237.6 | 10 | 0.5 | |
ERNIE-3.5-128K-Preview | TPM = 10000 RPM = 33 |
17000 | 237.6 | 40 | 0.5 | |
ERNIE Lite | ERNIE-Lite-8K | TPM = 10000 RPM = 33 |
1200 | 54 | 3 | 0.12 |
ERNIE Lite Pro | ERNIE-Lite-Pro-128K | TPM = 10000 RPM = 2 |
109.8 | 54.9 | 0.225 | 0.1125 |
ERNIE Speed Pro | ERNIE-Speed-Pro-128K | TPM = 10000 RPM = 2 |
164.7 | 82.35 | 0.3375 | 0.16875 |
ERNIE Speed | ERNIE-Speed-8K | TPM = 10000 RPM = 33 |
1900 | 81 | 5 | 0.2 |
ERNIE-Speed-128K | TPM = 10000 RPM = 2 |
7600 | 81 | 20 | 0.2 | |
ERNIE Tiny | ERNIE-Tiny-8K | TPM = 10000 RPM = 33 |
400 | 400 | 1 | 1 |
ERNIE Character | ERNIE-Character-8K | TPM = 10000 RPM = 33 |
1900 | 1900 | 5 | 5 |
ERNIE-Character-Fiction-8K | TPM = 10000 RPM = 33 |
1900 | 1900 | 5 | 5 | |
ERNIE Novel | ERNIE-Novel-8K | TPM = 10000 RPM = 33 |
27000 | 1512 | 55 | 3.2 |
Qwen2.5 | Qwen2.5-7B-Instruct | TPM = 10000 RPM = 33 |
270 | 270 | 0.56 | 0.56 |
Qwen3 | Qwen3-32B | TPM = 10000 RPM = 20 |
1512 | 1512 | 3.15 | 3.15 |
模型名称 | 版本名称 | 子项 | 单位规格 | 预付费价格(单位:元/个/月) | |
---|---|---|---|---|---|
原价 | 活动价 | ||||
ERNIE 4.5 Turbo | ERNIE-4.5-Turbo-32K | 输入 | 10k | 346 | 242 |
输出 | 1k | 138.2 | 96.8 | ||
ERNIE-4.5-Turbo-128K | 输入 | 10k | 346 | 242 | |
输出 | 1k | 138.2 | 96.8 | ||
ERNIE 4.5 Turbo VL | ERNIE-4.5-Turbo-VL-32K | 输入 | 10k | 1296 | 907 |
输出 | 1k | 388.8 | 272.2 | ||
DeepSeek-V3 | DeepSeek-V3 | 输入 | 10k | 864 | 604.8 |
输出 | 1k | 345.6 | 241.92 |
备注信息: RPM = Max(服务总输入TPM/10k,服务总输出TPM/1k) * 20
视觉理解
按量后付费
模型名称 | 版本名称 | 服务内容 | 子项 | 在线推理 | 批量推理 | 单位 |
---|---|---|---|---|---|---|
ERNIE 4.5 Turbo VL | ERNIE-4.5-Turbo-VL-Preview ERNIE-4.5-Turbo-VL-32K ERNIE-4.5-Turbo-VL-32K-Preview |
推理服务 | 输入 | 0.003 | 0.0012 | 元/千tokens |
输出 | 0.009 | 0.0036 | 元/千tokens | |||
ERNIE 4.5 | ERNIE-4.5-8K | 推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
输出 | 0.016 | 0.0064 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
ERNIE 4.5 | ERNIE-4.5-VL-28B-A3B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 |
0.004 | 0.0016 | 元/千tokens | |||
Llama-4-Maverick | Llama-4-Maverick-17B-128E-Instruct | 推理服务 | 输入 | 0.007 | 0.0028 | 元/千tokens |
输出 | 0.021 | 0.0084 | 元/千tokens | |||
Llama-4-Scout | Llama-4-Scout-17B-16E-Instruct | 推理服务 | 输入 | 0.006 | 0.0024 | 元/千tokens |
输出 | 0.018 | 0.0072 | 元/千tokens | |||
Qianfan-Llama-VL-8B | Qianfan-Llama-VL-8B | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.005 | 0.002 | 元/千tokens | |||
Qianfan-QI-VL | Qianfan-QI-VL | 推理服务 | 输入 | 0.0015 | 0.0006 | 元/千tokens |
输出 | 0.0045 | 0.0018 | 元/千tokens | |||
Qianfan-MultiPicOCR | Qianfan-MultiPicOCR | 推理服务 | 输入 | 0.0025 | 0.001 | 元/千tokens |
输出 | 0.0075 | 0.003 | 元/千tokens | |||
Qianfan-PublicOpinion-Classification | Qianfan-PublicOpinion-Classification | 推理服务 | 输入 | 0.0015 | 0.0006 | 元/千tokens |
输出 | 0.0045 | 0.0018 | 元/千tokens | |||
Qianfan-Composition | Qianfan-Composition | 推理服务 | 输入 | 0.0025 | 0.001 | 元/千tokens |
输出 | 0.0075 | 0.003 | 元/千tokens | |||
Qwen2.5-VL | Qwen2.5-VL-7B-Instruct | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.005 | 0.002 | 元/千tokens | |||
Qwen2.5-VL | Qwen2.5-VL-32B-Instruct | 推理服务 | 输入 | 0.008 | - | 元/千tokens |
输出 | 0.024 | - | 元/千tokens | |||
InternVL3 | InternVL3-38B | 推理服务 | 输入 | 0.008 | 0.0032 | 元/千tokens |
输出 | 0.024 | 0.0096 | 元/千tokens | |||
InternVL3 | InternVL3-14B | 推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
输出 | 0.012 | 0.0048 | 元/千tokens | |||
InternVL3 | InternVL3-1B | 推理服务 | 输入 | 0.0004 | 0.00016 | 元/千tokens |
输出 | 0.0012 | 0.00048 | 元/千tokens | |||
InternVL2_5 | InternVL2_5-38B-MPO | 推理服务 | 输入 | 0.008 | - | 元/千tokens |
输出 | 0.024 | - | 元/千tokens | |||
DeepSeek-VL2 | DeepSeek-VL2 | 推理服务 | 输入 | 0.00099 | - | 元/千tokens |
输出 | 0.00099 | - | 元/千tokens | |||
DeepSeek-VL2 | DeepSeek-VL2-Small | 推理服务 | 输入 | 0.0005 | - | 元/千tokens |
输出 | 0.0005 | - | 元/千tokens |
按TPM付费
注:文档中的商品价格可能存在延迟,最终价格以订单页为准。
模型名称 | 版本名称 | 子项 | 单位规格 | 预付费价格(单位:元/个/月) | |
---|---|---|---|---|---|
原价 | 活动价 | ||||
ERNIE 4.5 Turbo VL | ERNIE-4.5-Turbo-VL-32K | 输入 | 10k | 1296 | 907 |
输出 | 1k | 388.8 | 272.2 |
备注信息: RPM = Max(服务总输入TPM/10k,服务总输出TPM/1k) * 20
深度思考
按量后付费
模型名称 | 版本名称 | 服务内容 | 子项 | 在线推理 | 批量推理 | 单位 |
---|---|---|---|---|---|---|
ERNIE X1 Turbo | ERNIE-X1-Turbo-32K ERNIE-X1-Turbo-32K-Preview |
推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.0016 | 元/千tokens | |||
ERNIE X1 | ERNIE-X1-32K ERNIE-X1-32K-Preview |
推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
ERNIE 4.5 | ERNIE-4.5-VL-28B-A3B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.01 | 0.004 | 元/千tokens | |||
DeepSeek-R1 | DeepSeek-R1-250528 | 推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
输出 | 0.016 | 0.0064 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
DeepSeek-R1 | DeepSeek-R1 | 推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
输出 | 0.016 | 0.0064 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
DeepSeek-R1-Distill-Qianfan-70B | DeepSeek-R1-Distill-Qianfan-70B | 推理服务 | 输入 | 0.002 | 0.008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
DeepSeek-R1-Distill-Qianfan-8B | DeepSeek-R1-Distill-Qianfan-8B | 推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.00016 | 元/千tokens | |||
DeepSeek-R1-Distill-Qianfan-Llama-70B | DeepSeek-R1-Distill-Qianfan-Llama-70B | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
DeepSeek-R1-Distill-Qianfan-Llama-8B | DeepSeek-R1-Distill-Qianfan-Llama-8B | 推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.00016 | 元/千tokens | |||
DeepSeek-R1-Distill-Llama-70B | DeepSeek-R1-Distill-Llama-70B | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
DeepSeek-R1-Distill-Llama-8B | DeepSeek-R1-Distill-Llama-8B | 推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.00016 | 元/千tokens | |||
DeepSeek-R1-Distill-Qwen-32B | DeepSeek-R1-Distill-Qwen-32B | 推理服务 | 输入 | 0.0015 | 0.0006 | 元/千tokens |
输出 | 0.006 | 0.0024 | 元/千tokens | |||
DeepSeek-R1-Distill-Qwen-14B | DeepSeek-R1-Distill-Qwen-14B | 推理服务 | 输入 | 0.0006 | 0.00024 | 元/千tokens |
输出 | 0.0024 | 0.00096 | 元/千tokens | |||
DeepSeek-R1-Distill-Qwen-7B | DeepSeek-R1-Distill-Qwen-7B | 推理服务 | 输入 | 0.0005 | 0.0002 | 元/千tokens |
输出 | 0.002 | 0.0008 | 元/千tokens | |||
DeepSeek-R1-Distill-Qwen-1.5B | DeepSeek-R1-Distill-Qwen-1.5B | 推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.0012 | 0.00048 | 元/千tokens | |||
GLM-Z1-32B-0414 | GLM-Z1-32B-0414 | 推理服务 | 输入 | 0.002 | 0.0018 | 元/千tokens |
输出 | 0.008 | 0.0018 | 元/千tokens | |||
GLM-Z1-Rumination-32B-0414 | GLM-Z1-Rumination-32B-0414 | 推理服务 | 输入 | 0.005 | 0.0018 | 元/千tokens |
输出 | 0.02 | 0.0018 | 元/千tokens | |||
Qwen3 | Qwen3-235B-A22B-Thinking-2507 | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.02 | 0.008 | 元/千tokens | |||
Qwen3 | Qwen3-235B-A22B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.02 | 0.008 | 元/千tokens | |||
Qwen3 | Qwen3-30B-A3B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.00075 | 0.0003 | 元/千tokens |
输出 | 0.0075 | 0.003 | 元/千tokens | |||
Qwen3 | Qwen3-32B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.02 | 0.008 | 元/千tokens | |||
Qwen3 | Qwen3-14B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.01 | 0.004 | 元/千tokens | |||
Qwen3 | Qwen3-8B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0005 | 0.0002 | 元/千tokens |
输出 | 0.005 | 0.002 | 元/千tokens | |||
Qwen3 | Qwen3-4B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.003 | 0.0012 | 元/千tokens | |||
Qwen3 | Qwen3-1.7B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.003 | 0.0012 | 元/千tokens | |||
Qwen3 | Qwen3-0.6B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.003 | 0.0012 | 元/千tokens | |||
QWQ-32B | QWQ-32B | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.006 | 0.0024 | 元/千tokens |
按量包付费
注:文档中的商品价格可能存在延迟,最终价格以订单页为准。
量包名称 | 量包额度(Tokens) | 服务速率限制 | 有效期 | 原价(元) | 折扣率 | 折后价(元) |
---|---|---|---|---|---|---|
DeepSeek-V3 系列预置服务共享量包 |
1亿 | TPM = 1000K RPM = 5,000 |
3个月 | 350 | 90% | 315 |
5亿 | TPM = 1500K RPM = 5,000 |
3个月 | 1,750 | 85% | 1,487.5 | |
10亿 | TPM = 2000K RPM = 5,000 |
3个月 | 3,500 | 80% | 2,800 | |
DeepSeek-R1 系列预置服务共享量包 |
1亿 | TPM = 1000K RPM = 5,000 |
3个月 | 700 | 90% | 630 |
5亿 | TPM = 1500K RPM = 5,000 |
3个月 | 3,500 | 85% | 2,975 | |
10亿 | TPM = 2000K RPM = 5,000 |
3个月 | 7,000 | 80% | 5,600 | |
ERNIE-X1-Turbo-32K 系列预置服务共享量包 |
1亿 | TPM = 300K RPM = 900 |
6个月 | 175 | 90% | 157.5 |
5亿 | TPM = 450K RPM = 900 |
6个月 | 875 | 85% | 743.75 | |
10亿 | TPM = 750K RPM = 900 |
6个月 | 1,750 | 80% | 1,400 |
按TPM付费
注:文档中的商品价格可能存在延迟,最终价格以订单页为准。
模型名称 | 版本名称 | 单位规格 | 预付费(元/个/月) | 后付费(元/个/小时) | ||
---|---|---|---|---|---|---|
原价 | 活动价 | 原价 | 活动价 | |||
ERNIE X1 | ERNIE-X1-32K | TPM = 10000 RPM = 33 |
1512 | 1512 | 3.15 | 3.15 |
ERNIE-X1-32K-Preview | TPM = 10000 RPM = 33 |
1512 | 1512 | 3.15 | 3.15 | |
DeepSeek-R1-Distill-Qwen-32B | DeepSeek-R1-Distill-Qwen-32B | TPM = 10000 RPM = 33 |
1135 | 1135 | - | - |
DeepSeek-R1-Distill-Qwen-14B | DeepSeek-R1-Distill-Qwen-14B | TPM = 10000 RPM = 33 |
454 | 454 | - | - |
模型名称 | 版本名称 | 子项 | 单位规格 | 预付费价格(单位:元/个/月) | |
---|---|---|---|---|---|
原价 | 活动价 | ||||
ERNIE X1 Turbo | ERNIE-X1-Turbo-32K | 输入 | 10k | 432 | 302 |
输出 | 1k | 172.8 | 121 | ||
DeepSeek-R1 | DeepSeek-R1 | 输入 | 10k | 1728 | 1209.6 |
输出 | 1k | 691.2 | 483.84 | ||
DeepSeek-R1 | DeepSeek-R1-250528 | 输入 | 10k | 1728 | 1209.6 |
输出 | 1k | 691.2 | 483.84 |
备注信息: RPM = Max(服务总输入TPM/10k,服务总输出TPM/1k) * 20
图像生成
模型 | 服务内容 | 单价 | 规格 |
---|---|---|---|
irag-1.0 | 推理服务 | 0.14元/张 | 1024x1024 |
FLUX.1-schnell | 推理服务 | 限时0.002元/张 | - |
Stable-Diffusion-XL | 推理服务 | 0.02元/秒,具体计算逻辑,参考下表。 | 768x768、576x1024、1024x576,3秒/张 * ¥0.02元/秒=¥0.06元/张 |
768x1024、1024x768、1024x1024,4秒/张 * ¥0.02元/秒=¥0.08元/张 | |||
1536x1536、1152x2048、2048x1152,6秒/张 * ¥0.02元/秒=¥0.12元/张 | |||
1536x2048、2048x1536、2048x2048,8秒/张 * ¥0.02元/秒=¥0.16元/张 |
图像编辑
模型 | 服务内容 | 单价 | 单位 |
---|---|---|---|
ernie-irag-edit | 推理服务 | 0.14 | 元/张 |
文本向量
模型名称 | 服务内容 | 子项 | 单价 | 单位 |
---|---|---|---|---|
Embedding-V1 | 推理服务 | 输入 | 0.0005 | 元/千tokens |
bge-large-zh | 推理服务 | 输入 | 0.0005 | 元/千tokens |
bge-large-en | 推理服务 | 输入 | 0.0005 | 元/千tokens |
tao-8k | 推理服务 | 输入 | 0.0005 | 元/千tokens |
Qwen3-Embedding-0.6B | 推理服务 | 输入 | 0.0005 | 元/千tokens |
Qwen3-Embedding-4B | 推理服务 | 输入 | 0.0005 | 元/千tokens |
多模态向量
模型名称 | 版本名称 | 服务内容 | 子项 | 单价 | 单位 |
---|---|---|---|---|---|
gme-Qwen2-VL-2B-Instruct | gme-Qwen2-VL-2B-Instruct | 推理服务 | |||
输入 | 0.001 | 元/千tokens |
重排序
模型名称 | 服务内容 | 子项 | 单价 | 单位 |
---|---|---|---|---|
bce-reranker-base | 推理服务 | 输入 | 0.0005 | 元/千tokens |
模型内置工具价格
联网搜索
按次使用量后付费
基于用户query,大模型自动判断是否触发联网搜索查询相关文献。如果触发联网搜索,则基于搜索结果进行总结回答。如果不触发联网搜索,大模型直接回答。
触发联网搜索包括两部分费用:
- 按次收费:如果触发搜索,会收取一次联网搜索费用,单次价格见下面表格。
- 联网搜索search_tokens费用:联网搜索会将检索到的内容输入给大模型,导致输入模型tokens增加,在推理接口返回的
usage.prompt_tokens_details.search_tokens
当中体现。
服务内容 | 单价 | 单位 |
---|---|---|
搜索增强 | 0.004 | 元/次 |
欠费账户继续推送计费说明:如果你购买了tokens量包预付费/tpm预付费,即使账户欠费,大模型服务调用依然正常。如果此时触发联网搜索,会继续向您的账户推送联网搜索0.004元/次的billing账单。只有当tokens量包预付费使用完毕或者tpm预付费到期,才会停止触发联网搜索。
按次量包预付费
触发搜索增强时,如已购买搜索增强量包,则会优先抵扣量包,量包耗尽或过期后恢复至按次计费。
当前规格及计费如下所示:
次数 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|
10000次????? | 6个月????? | ¥40??? | 95%?? | ¥38??? |
50000次????? | 6个月????? | ¥200?? | 95%?? | ¥190 |
阅读助手插件
按次使用量后付费
基于plugins入参和用户query,模型自动判断是否调起插件。如果触发插件,则基于文档内容总结回复。如果不触发,大模型直接回答。
触发插件回复包含两部分费用:
- 按次收费:如果触发插件,会收取一次插件费用,单次价格见下面表格。
- plugin_tokens费用:触发阅读助手插件后,插件会读取需要阅读的文档/网页内容,并对用户的prompt进行一定扩写,导致输入模型的token增加,在推理接口返回的
usage.prompt_tokens_details.plugin_tokens
插件 | 服务内容 | 单价 |
---|---|---|
阅读助手插件 | 推理服务 | ¥0.01元/每次 |
欠费账户继续推送计费说明:如果你购买了tokens量包预付费/tpm预付费,即使账户欠费,大模型服务调用依然正常。如果此时触发阅读助手插件,会继续向您的账户推送阅读助手插件0.01元/次的billing账单。只有当tokens量包预付费使用完毕或者tpm预付费到期,才会停止触发阅读助手插件。
算力单元价格
购买算力单元限时5折起优惠,活动时间:2025-08-04~2025-08-04。
当您通过购买算力单元部署服务时,付费信息选择分为以下两种方式:
预付费
预付费购买的算力单元,按月计费,购买成功后开始计时。具体价格如下:
资源类型 | 规格 | 原单价(元/月) | 折后价(元/月) |
---|---|---|---|
AI加速卡Ⅰ型 | 1个算力单元 | 15,000 | (5折后) 7,500 |
AI加速卡Ⅴ型 | 1个算力单元 | 9,000 | (5折后) 4,500 |
AI加速卡Ⅵ型 | 1个算力单元 | 9,000 | (5折后) 4,500 |
AI加速卡Ⅶ型 | 1个算力单元 | 15,000 | (5折后) 7,500 |
CPU | 1个算力单元 | 3,900 | (5折后) 1,950 |
预付费购买的算力单元支持开启/关闭自动续费功能,您可在千帆产品控制台按需设置。
使用中状态的预付费算力单元支持变配(仅升配)功能,您可在千帆产品控制台按需使用。资源变配可能会带来额外的消费,计费规则如下:
- 公式:(新配置单价- 旧配置单价)* 原订单剩余时长(大于24小时,向下取整;小于24小时,向上取整)
- 例如:剩余时间为5天时发起扩容,扩容当天不收费,只收取剩余5天的扩容费用;剩余时间为8小时时,扩容收取当天全天的费用;
后付费
后付费购买的算力单元,按分钟计费,按小时出账。使用时长小于15分钟按15分钟收费,超过15分钟按照实际使用时长收费。具体价格如下:
资源类型 | 规格 | 原单价(元/分钟) | 折后价(元/分钟) |
---|---|---|---|
AI加速卡Ⅰ型 | 1个算力单元 | 0.52 | (5折后) 0.26 |
AI加速卡Ⅴ型 | 1个算力单元 | 0.32 | (5折后) 0.16 |
AI加速卡Ⅵ型 | 1个算力单元 | 0.32 | (5折后) 0.16 |
AI加速卡Ⅶ型 | 1个算力单元 | 0.52 | (5折后) 0.26 |
CPU | 1个算力单元 | 0.17 | (5折后) 0.085 |
后付费购买的算力单元支持设置定时释放时间,默认处于关闭状态,您可在千帆产品控制台按需设置。
使用中状态的后付费算力单元支持变配(升配/降配)功能,您可在千帆产品控制台按需使用。后付费算力单元根据使用时长后付费,变配成功后,价格会根据新配置自动变更。
价格费用举例
算力单元的开始时间以服务部署成功时间为准。
示例1:预付费购买1个月的AI加速卡Ⅰ型算力单元
单副本算力单元数为2,副本数自定义为2,则最终需要购买的算力单元总数为2*2=4个,购买一个月的总价格为:
1(月) x
2(单副本算力单元) x
2(副本数) x
15,000(元/月x 1副本 x 1算力单元) = 60,000 元
活动期间,购买AI加速卡算力单元享有5折优惠,所以折后价为30,000元。
微调模型按token后付费价格
平台部分基座模型,其微调以后的模型,支持发布为按token后付费的服务,其付费规格如下:
SFT基础模型 | 模型版本 | 原价 | 折扣价 |
---|---|---|---|
ERNIE Speed | ERNIE-Speed-8K | 输入:0.012元/千tokens 输出:0.024元/千tokens |
输入:0.004元/千tokens 输出:0.008元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0308 | 输入:0.009元/千tokens 输出:0.018元/千tokens |
输入:0.003元/千tokens 输出:0.006元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0922 | 0.024元/千tokens | 0.008元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0725 | 0.024元/千tokens | 0.008元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0704 | 0.024元/千tokens | 0.008元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0516 | 0.024元/千tokens |
0.008元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B | 0.012元/千tokens | 0.004元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B-32K | 0.012元/千tokens | 0.004元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-13B | 0.018元/千tokens | 0.006元/千tokens |
ChatGLM | chatglm2-6b | 0.012元/千tokens | 0.004元/千tokens |
ChatGLM | chatglm2-6b-32k | 0.012元/千tokens | 0.004元/千tokens |
Baichuan2 | Baichuan2-7B-Chat | 0.012元/千tokens | 0.004元/千tokens |
Baichuan2 | Baichuan2-13B-Chat | 0.018元/千tokens | 0.006元/千tokens |
SQLCoder-7B | sqlcoder-7b | 0.012元/千tokens | 0.004元/千tokens |
CodeLlama | CodeLlama-7b-Instruct | 0.012元/千tokens | 0.004元/千tokens |
BLOOMZ-7B | BLOOMZ-7B | 0.012元/千tokens | 0.004元/千tokens |
重要说明:
- SFT微调模型发布为按token后付费的服务,不支持选择算力单元数量,只支持小流量体验使用
- 支持SFT微调模型按token后付费的资源有限,当资源被占满时,用户将无法发布
- 1个智能云账户只能发布一个SFT微调模型按token后付费服务