在AWS上自建和运行LLAMA（大型语言模型）的成本是多少？

由于多种原因，一些企业倾向于在其AI应用程序中使用较弱的开源大型语言模型（LLM）。

做出这种决策的人通常希望节省调用API的成本，或者不信任AI服务提供商的数据保护设施。

Multiable对采用任何一种私有部署的LLM没有倾向性。无论如何，让我们来看看采用自有的LLAMA（目前最受欢迎的开放源码LLM之一）在亚马逊网络服务（AWS）上运行的成本。

许多人在计划将一个“可用”的LLAMA设置在云端时常常犯错误，特别是忽略了生产运行所需的一系列云端服务。

是的，可能有五分之一的IT人员会使用UAT环境的成本来申请管理层的预算，然后当系统上线时事情变得糟糕！

事实上，在AWS上托管大型语言模型架构（LLAMA）涉及与不同AWS服务相关的多种成本组件。

1、Amazon EC2（弹性计算云）

价格取决于所选的实例类型和配置。建议使用GPU实例，如2xlarge进行密集的机器学习任务。
2xlarge实例：每小时约3.06美元
8xlarge实例：每小时约12.24美元
预留实例和Spot实例可以显着节省成本。

2、Amazon S3（简单存储服务）

用于存储数据集和模型检查点。
标准存储：每月每GB 0.023美元
不常访问的存储：每月每GB 0.0125美元
Glacier存储（用于归档模型）：每月每GB 0.004美元。

3、Amazon EBS（弹性块存储）

为EC2实例提供持久块存储。
通用型SSD（gp2）：每月每GB 0.10美元
预置IOPS SSD（io1）：根据预置IOPS和存储大小而定

4、Amazon VPC（虚拟私有云）

在服务之间数据传输可能产生网络费用。
数据传出：每月前1GB免费，之后每GB 0.09美元（上限10TB/月）

5、AWS Lambda

用于处理的无服务器函数。
Lambda函数：每百万次请求20美元，加上每GB-秒计算时间0.00001667美元

6、Amazon CloudWatch

为基础设施提供监控和日志服务。
自定义指标：每月每个指标30美元
日志：每GB导入50美元，每GB归档0.03美元

托管和运行自有LLAMA在AWS上的年度成本取决于多种因素，包括计算能力、数据存储、网络传输成本和其他辅助服务。

计算：AWS提供适用于大型语言模型的各种实例，例如基于GPU的EC2实例。使用p3.8xlarge实例，其费用约为12.24美元/小时，持续运行一年费用约为107,136美元。
存储：Amazon S3或EBS提供灵活的存储选项。高性能EBS每GB约0.10美元/月，假设需要10TB存储，年度费用约为12,000美元。
网络传输：数据传输成本因数据量而异，估计每月500美元，则年度约为6,000美元。
附加服务：使用AWS Lambda、API Gateway或其他服务可增加约5,000美元的辅助成本。

粗略估算的年度总成本如下：

计算：107,136美元
存储：12,000美元
网络传输：6,000美元
附加服务：5,000美元

总计：约130,136美元/年

请注意，上述费用仅涵盖AWS的云服务成本，未包括人力成本，这部分费用会根据客户的具体需求而有所不同。

LAIDFU，一个以无代码方式（No Code Approach）可配置的企业AI Agent，允许用户在其应用程序中使用不同的AI服务提供商，包括OpenAI、百度以及自己的DeepSeek或LLAMA。用户可以自由选择最合适的大型语言模型（LLM）来执行用户定义的使用案例，针对各种业务流程进行操作。

在AWS上自建和运行LLAMA（大型语言模型）的成本是多少？