财中社1月6日电西部证券发布AI行业追踪45期。文中写到DeepSeek-V3锤真金不怕火和使用资本大幅裁汰,或有望助力买卖端落地算力优化。
引入FP8锤真金不怕火和细粒度量化战术,大幅裁汰计较技能。比拟于Meta的Llama3需要16384块上半年00 GPU锤真金不怕火,DeepSeek-V3仅需2048块H800 GPU即可完成疏通界限的任务,锤真金不怕火资本低至约557万好意思元。
用户使用门槛裁汰:1)软硬件一体化因循,莳植推理后果。DeepSeek首发因循国内昇腾平台(Ascend)和MindIE推理引擎,股票融资这种软硬件一体化的因循使得用户大致在不同的硬件环境中天真高效地部署模子。2)因循多种主流框架、全面开源战术。模子因循SGLang、LMDeploy和TensorRT-LLM等多个主流框架,配置者不错字据自己需求接纳合乎的配置器具和框架。3)天的确API订价模子,裁汰每百万token的处理资本。
西部证券合计,DeepSeek-V3的领略给前沿LLM锤真金不怕火降本带来新的处置旅途和可能性,模子端使用资本的下跌有助于激动买卖端落地的闭环。