根据Gartner最新发布的预测,到2030年,在大型语言模型(LLM)上进行推理的成本有望降低90%以上。这一显著的成本下降主要得益于硬件效率的提升、模型优化技术的进步以及行业竞争的加剧。 报告指出,随着专用AI芯片的普及、模型压缩和蒸馏等技术的发展,单位推理成本将大幅下降。同时,云服务提供商和AI公司的激烈竞争也将推动价格进一步降低。这一趋势将使得更多企业能够负担得起大规模AI部署,加速生成式AI在各类业务场景中的应用。 成本降低预计将推动AI从实验阶段转向规模化落地,特别是在客户服务、内容。
本文来源:新浪新闻