深度学习模型部署与优化：策略与实践；L40S与A100、H100的对比分析

随着生成式AI应用的迅猛发展，我们正处在前所未有的大爆发时代。在这个时代，深度学习模型的部署成为一个亟待解决的问题。尽管GPU在训练和推理中扮演着关键角色，但关于它在生成式AI领域的误解仍然存在。近期英伟达L40S GPU架构成为了热门话题，那么与A100和H100相比，L40S有哪些优势呢？

阅读全文 → 2023-10-06

高性能计算环境下的深度学习异构集群建设与优化实践

随着人工智能在工业和学术界大规模的应用，深度学习训练需求日益迫切。各组织机构投入大量资金购置和搭建配置GPU和InfiniBand网卡异构计算集群。集群管理系统(也称平台)支持模型训练，提供作业、数据和模型管理，并提供资源隔离。资源管理系统是深度学习系统的基础，企业级场景下，上层框架和应用通常在资源管理系统提供的资源上运行。

阅读全文 → 2023-09-24

Stable Diffusion的完整指南：核心基础知识、制作AI数字人视频和本地部署要求

Stable Diffusion是一种扩散模型（diffusion model）的变体，叫做“潜在扩散模型”（latent diffusion model; LDM）。扩散模型是在2015年推出的，其目的是消除对训练图像的连续应用高斯噪声，可以将其视为一系列去噪自编码器。Stable Diffusion由3个部分组成：变分自编码器（VAE）、U-Net和一个文本编码器。添加和去除高斯噪声的过程被应用于这个潜在表示，然后将最终的去噪输出解码到像素空间中。在前向扩散过程中，高斯噪声被迭代地应用于压缩的潜在表征

阅读全文 → 2023-09-17

揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速

本文主要介绍大模型的内部运行原理、我国算力发展现状。大模型指具有巨大参数量的深度学习模型，如GPT-4。其通过在大规模数据集上进行训练，能够产生更加准确和有创造性的结果。大模型的内部运行原理包括输入数据的处理、多层神经网络计算和输出结果生成。这些模型通常由数十亿个参数组成，需要庞大的计算资源和高速的存储器来进行训练和推理。

阅读全文 → 2023-09-09

如何在SAM时代下打造高效的高性能计算大模型训练平台

Segment Anything Model (SAM)是Meta 公司最近推出的一个创新AI 模型，专门用于计算机视觉领域图像分割任务。借鉴ChatGPT 的学习范式，将预训练和特定任务结合在一起，从而显著提升模型的泛化能力。SAM 的设计初衷是简化图像分割的过程，减少对专业建模知识的依赖，并降低大规模训练所需的计算资源。

阅读全文 → 2023-08-21

英伟达 H100 vs. 苹果M2，大模型训练，哪款性价比更高？

训练和微调大型语言模型对于硬件资源的要求非常高。目前，主流的大模型训练硬件通常采用英特尔的CPU和英伟达的GPU。然而，最近苹果的M2 Ultra芯片和AMD的显卡进展给我们带来了一些新的希望。

阅读全文 → 2023-07-28

首页上一页 7 8 9 10 11 12 13 14 15 16 下一页尾页