logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-V3 模型到底强在哪,以及如何运行它?

近日,“杭州深度求索”推出了其最新的大型语言模型DeepSeek V3,这是一款强大的专家混合(Mixture-of-Experts, MoE)架构语言模型,总参数量达到671B,每个token激活的参数量为37B。经过综合测试它的性能已经比肩GPT-4o、Claude。这个消息在AI圈像一个新年烟花一样炸开。本文将来看看这个新的模型的特性,以及与其它模型的指标对比。然后在最后,我们在 H800

#人工智能#机器学习#GPU +1
DeepSeek-V3 模型到底强在哪,以及如何运行它?

近日,“杭州深度求索”推出了其最新的大型语言模型DeepSeek V3,这是一款强大的专家混合(Mixture-of-Experts, MoE)架构语言模型,总参数量达到671B,每个token激活的参数量为37B。经过综合测试它的性能已经比肩GPT-4o、Claude。这个消息在AI圈像一个新年烟花一样炸开。本文将来看看这个新的模型的特性,以及与其它模型的指标对比。然后在最后,我们在 H800

#人工智能#机器学习#GPU +1
DigitalOcean H200 GPU裸机服务器上线!可更好支持DeepSeek满血版

在 DigitalOcean,我们始终致力于为开发者、初创企业和人工智能驱动型公司提供更便捷的高性能计算资源,助力其业务扩展。今日,DigitalOcean 隆重推出基于 NVIDIA HGX H200 AI 超级计算平台的裸机服务器,专为高性能AI工作负载而生。无论你是在训练大规模模型、优化AI系统,还是在执行实时推理任务,NVIDIA H200 GPU都能提供强大的性能支撑和灵活的应用场景,加

文章图片
#人工智能
DeepSeek不同版本私有化部署成本对比:企业如何选择最优方案?

2025年,随着DeepSeek开源模型的爆发式增长,企业私有化部署AI的需求呈现出两极分化的态势。一方面,R1、V3等版本模型凭借“性能对标GPT-4、成本仅10%”的标签,推动AI从实验室走向产业核心场景;另一方面,硬件投入动辄百万级、算力资源分配复杂化等问题,也让企业陷入“效率与成本”的权衡困境。本文将从硬件配置、带宽需求、综合成本等维度,拆解DeepSeek不同版本的私有化部署方案,为企业

文章图片
#人工智能#GPU
DeepSeek-R1 1.5b、7b、8b、14b、32b、70b和671b几个版本中怎么选,部署指南

模型选型本质是性能与成本的博弈。建议初创公司从7B模型起步,成熟企业采用32B云端方案,而671B模型目前仍属于"技术战略储备"。随着技术进步,2025年70B级模型有望进入企业本地部署范畴,届时行业将迎来新一轮智能化变革。如果你希望采用云端部署,欢迎了解 Digitalocean 的 H100 GPU Droplet 服务器以及即将上线的 H200 GPU 云服务器,可直接联系Digitaloc

文章图片
#人工智能
DeepSeek-V3 模型到底强在哪,以及如何运行它?

近日,“杭州深度求索”推出了其最新的大型语言模型DeepSeek V3,这是一款强大的专家混合(Mixture-of-Experts, MoE)架构语言模型,总参数量达到671B,每个token激活的参数量为37B。经过综合测试它的性能已经比肩GPT-4o、Claude。这个消息在AI圈像一个新年烟花一样炸开。本文将来看看这个新的模型的特性,以及与其它模型的指标对比。然后在最后,我们在 H800

#人工智能#机器学习#GPU +1
DeepSeek-V3 模型到底强在哪,以及如何运行它?

近日,“杭州深度求索”推出了其最新的大型语言模型DeepSeek V3,这是一款强大的专家混合(Mixture-of-Experts, MoE)架构语言模型,总参数量达到671B,每个token激活的参数量为37B。经过综合测试它的性能已经比肩GPT-4o、Claude。这个消息在AI圈像一个新年烟花一样炸开。本文将来看看这个新的模型的特性,以及与其它模型的指标对比。然后在最后,我们在 H800

#人工智能#机器学习#GPU +1
H100、L4、A6000 等 9 款 GPU 横评,告诉你哪些适合模型训练,哪些适合AI 推理

对比分析NVIDIA 的 H100、A100、A6000、A4000、V100、P6000、RTX 4000、L40s、L4 九款GPU,哪些更推荐用于模型训练,哪些则更推荐用于推理。

文章图片
#人工智能#AIGC#深度学习 +1
如何从头开始构建神经网络?(附教程)

人工神经网络通常被称为神经网络、神经网或 NNs。这些网络受到生物神经元的启发。需要再次强调的是,实际上,生物神经元与用于构建神经网络架构的“神经元”之间几乎没有直接关联。尽管两者的基本工作方式截然不同,但它们的共同点在于,结合在一起时,这些“神经元”可以相对容易地解决复杂任务。为了理解神经网络的基本工作原理,线性方程“y = mx + c”是帮助理解神经网络的关键数学概念之一。方程中的“y =

文章图片
#神经网络#人工智能#深度学习 +2
只需 6 行代码,打造个人 AI 编程助手

在 Paperspace Gradient 上使用像 Code Llama 这样的人工智能助手探索编程的未来,改变开发者创建、调试和部署软件的方式。

文章图片
#人工智能#云服务#语言模型
    共 17 条
  • 1
  • 2
  • 请选择