在AWS上自建和运行LLAMA(大型语言模型)的成本是多少?

在AWS上自建和运行LLAMA(大型语言模型)的成本是多少?

2025-02-10T10:48:13+08:00 2025-02-10 10:48:13 上午|

由于多种原因,一些企业倾向于在其AI应用程序中使用较弱的开源大型语言模型(LLM)。

做出这种决策的人通常希望节省调用API的成本,或者不信任AI服务提供商的数据保护设施。

Multiable对采用任何一种私有部署的LLM没有倾向性。无论如何,让我们来看看采用自有的LLAMA(目前最受欢迎的开放源码LLM之一)在亚马逊网络服务(AWS)上运行的成本。

许多人在计划将一个“可用”的LLAMA设置在云端时常常犯错误,特别是忽略了生产运行所需的一系列云端服务。

是的,可能有五分之一的IT人员会使用UAT环境的成本来申请管理层的预算,然后当系统上线时事情变得糟糕!

事实上,在AWS上托管大型语言模型架构(LLAMA)涉及与不同AWS服务相关的多种成本组件。

1、Amazon EC2(弹性计算云)

  • 价格取决于所选的实例类型和配置。建议使用GPU实例,如2xlarge进行密集的机器学习任务。
  • 2xlarge实例:每小时约3.06美元
  • 8xlarge实例:每小时约12.24美元
  • 预留实例和Spot实例可以显着节省成本。

2、Amazon S3(简单存储服务)

  • 用于存储数据集和模型检查点。
  • 标准存储:每月每GB 0.023美元
  • 不常访问的存储:每月每GB 0.0125美元
  • Glacier存储(用于归档模型):每月每GB 0.004美元。

3、Amazon EBS(弹性块存储)

  • 为EC2实例提供持久块存储。
  • 通用型SSD(gp2):每月每GB 0.10美元
  • 预置IOPS SSD(io1):根据预置IOPS和存储大小而定

4、Amazon VPC(虚拟私有云)

  • 在服务之间数据传输可能产生网络费用。
  • 数据传出:每月前1GB免费,之后每GB 0.09美元(上限10TB/月)

5、AWS Lambda

  • 用于处理的无服务器函数。
  • Lambda函数:每百万次请求20美元,加上每GB-秒计算时间0.00001667美元

6、Amazon CloudWatch

  • 为基础设施提供监控和日志服务。
  • 自定义指标:每月每个指标30美元
  • 日志:每GB导入50美元,每GB归档0.03美元

 

托管和运行自有LLAMA在AWS上的年度成本取决于多种因素,包括计算能力、数据存储、网络传输成本和其他辅助服务。

  • 计算:AWS提供适用于大型语言模型的各种实例,例如基于GPU的EC2实例。使用p3.8xlarge实例,其费用约为12.24美元/小时,持续运行一年费用约为107,136美元。
  • 存储:Amazon S3或EBS提供灵活的存储选项。高性能EBS每GB约0.10美元/月,假设需要10TB存储,年度费用约为12,000美元。
  • 网络传输:数据传输成本因数据量而异,估计每月500美元,则年度约为6,000美元。
  • 附加服务:使用AWS Lambda、API Gateway或其他服务可增加约5,000美元的辅助成本。

粗略估算的年度总成本如下:

  • 计算:107,136美元
  • 存储:12,000美元
  • 网络传输:6,000美元
  • 附加服务:5,000美元

总计:约130,136美元/年

请注意,上述费用仅涵盖AWS的云服务成本,未包括人力成本,这部分费用会根据客户的具体需求而有所不同。

LAIDFU,一个以无代码方式(No Code Approach)可配置的企业AI Agent,允许用户在其应用程序中使用不同的AI服务提供商,包括OpenAI、百度以及自己的DeepSeek或LLAMA。用户可以自由选择最合适的大型语言模型(LLM)来执行用户定义的使用案例,针对各种业务流程进行操作。

 

Contact Us