GPU卡数估算
模型名称:
llama3
Mixtral
模型大小(B):
GPU 名称:
H100
A100
L40S
A10G
输入大小(ISL):
输出大小(OSL):
TTFT 时间(秒):
请求速率(Req/s):
提交