logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3 发布,阿里也要靠多模态和性价比打天下了

今天凌晨,阿里云正式发布了Qwen3系列,一口气开源了从0.6B到235B共8款模型:2个MoE大模型和6个Dense大模型,构成了阿里完整的模型矩阵。这次Qwen3的开源重塑了大模型标准,可以说在“后DeepSeek R1”时代,以阿里为代表的国内大厂,正在借助产品化思维,以性价比和多模态能力全方位抢夺DeepSeek的市场影响力。这回阿里云开源的Qwen3,在架构、性能、推理速度和应用方向上均

文章图片
#人工智能#AI
阿里云发布Qwen3:拉开新一轮开源模型竞赛的序幕

Qwen3 性能全面超越 R1、OpenAI-o1 等全球顶尖模型,旗舰型号的参数量仅为 DeepSeek-R1 的 1/3。2025 年已经过去 1/3,如果用关键词来概括 AI 领域的发展你会想到什么?这是我想到的:开源、创新加速加速加速。2 月是「DeepSeek」的,R1 以所有人意想不到的方式,让全球执牛耳的 AI 开发者、创业者、投资人把目光锁定在「DeepSeek」「中国」「开源」上

文章图片
#阿里云#人工智能#AI
Conda创建与激活虚拟环境(指定虚拟环境创建位置)

Conda是一个开源的软件包管理系统和环境管理系统,主要用于在不同的计算环境中安装和管理软件包和其依赖项。它最初是为Python而设计的,但现在也可以用于管理其他语言的软件包。Conda提供了对虚拟环境的支持,这使得用户可以在同一台计算机上同时管理多个相互独立的Python环境这对于开发和测试不同的项目或在项目之间切换时非常有用。总结:Conda所创建的,你的每一个Python项目所需的软件包等等

文章图片
#conda#人工智能#c# +2
DeepSeek本地部署(局域网+异地访问)数据库(保姆教程)

前面三个篇幅介绍本地部署DeepSeek+数据库及联网搜索的方法,后台又收到新的需求,“通过局域网或异地公网访问本地部署的DeepSeek+数据库”, 这是一个常见的场景,我也有用到,本次将整理分享配置“局域网或异地公网”访问的方法!DeepSeek本地部署全攻略:局域网共享+远程访问一体化方案【项目概述】关于DeepSeek 本地化部署、搭建个人知识库(资料库)、联网搜索及本地化可视化管理。共分

文章图片
#人工智能#DeepSeek#AI
百度强势反击!誓要夺回被DeepSeek抢占的市场份额

今天的故事开头,叫《重生之我在百度AI大会看李彦宏diss DeepSeek》。众所周知,DeepSeek在过去几个月里从模型能力到开放策略一路高歌猛进,俨然成了“国产大模型之光”。而在今天的百度AI开发者大会上,李彦宏却对DeepSeek频频打“DeepSeek不是万能的”,DeepSeek目前只能处理文本,还不能理解和生成图片、音频、视频等多模态内容,幻觉率较高,而且慢和贵。每年的AI开发者大

文章图片
#百度#AI#人工智能 +1
LLama-Factory实战:基于自建数据集微调qwen7B模型全解析!

LLama-Factory,大模型训练框架,支持多种模型,多种训练方式,link。

#人工智能#产品经理
大模型部署调用(vLLM+LangChain)

在上一章【[大模型三阶段训练方法(LLaMa Factory)]】内容中主要了解一个大模型的训练过程,无论是第三方的大模型还是自研的大模型,都需要部署到服务端,提供对应API接口供上层应用使用。所以,本章将主要了解vLLm + langchain的基本使用方法。

文章图片
#学习#人工智能#知识图谱 +1
一文了解什么是大模型?到底大模型有什么用呢?

*大模型是指具有大规模参数和复杂计算结构的机器学习模型。**这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。

文章图片
#人工智能#AI
DeepSeek深度赋能医生的6大应用场景

DeepSeek 与医疗场景的深度融合,就像一场悄无声息但又影响重大的革命,重塑了医生的工作模式,让医疗服务变得更加高效、精准。也为人类健康事业的持续发展注入了强大的科技动能,相信在不远的未来,随着AI技术的不断进步和完善,AI将在医疗领域发挥更加重要的作用,为更多患者带来健康和希望!

文章图片
#人工智能#AI#学习 +1
大模型学习与训练指南:100条实用建议,助你打造自己的大模型!

通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步积累经

文章图片
#人工智能#AI
    共 229 条
  • 1
  • 2
  • 3
  • 23
  • 请选择