logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型本地化管理工具Ollama

Ollama 管理本地已有大模型(包括终端对话界面)Ollama 导入模型到本地的三种方式:直接从 Ollama 远程仓库拉取、通过 GGUF 模型权重文件导入到本地、通过 safetensors 模型权限文件导入到本地。

文章图片
#人工智能
DeepSeek-R1模型全解析:从1.5B到671B,硬件需求与适用场景详解

DeepSeek-R1的本地化部署并非“参数越高越好”,而是需在性能、成本、场景需求间找到平衡点。个人用户可从1.5B模型入手,通过Ollama快速体验;中小企业推荐14B-32B量化版,兼顾精度与成本;而满血版671B则是国家级项目的“重器”。未来,随着MoE架构和芯片制程的进步,AI本地化门槛将进一步降低,全民智算时代或将触手可及。

文章图片
#人工智能#AI
基于LangChain构建RAG应用,非常详细收藏我这一篇就够了

Hello,大家好,我是GISer Liu😁,一名热爱AI技术的GIS开发者,上一篇文章中我们详细介绍了RAG的核心思想以及搭建向量数据库的完整过程;😲将LLM接入LangChain:选择LLM,然后在LangChain中使用;构建检索问答链:使用语法构建RAG问答链部署知识库助手:使用streamlit部署项目;帮助读者快速构建RAG应用并部署在阿里云服务器上;Streamlit是一个开源的

文章图片
#人工智能
DeepSeekR1 劲敌出现了,QwQ32B本地部署测试,RTX3060成功运行!

阿里千问平,突然在凌晨3点发布了最新推理模型!发布说明很简单“然后在下面甩出来几个链接,包括博客,HF,模型,演示和在线使用的网站。这条消息很简单,但是背后的东西一点都不简单。就凭一句可以,这成功了勾起了我的兴趣。除了文字描述之外, 推文中还给出了一张基准测试的图片。图中显示了 QwQ32B 和 deepseekR1 671B,以及 openai-o1的基准测试。从这个途中可以轻松的获取以下几点信

文章图片
#人工智能#RAG
DeepSeek 全面指南,90% 的人都不知道的使用技巧(建议收藏)

大家好,我是欧巴。如果用一个词来形容你此时此刻的感受,是什么?(请打在留言区)从一个月之前 DeepSeek-V3 发布后,我就一直在更新 DeepSeek 相关的文章和视频,因为我认为这是一家非常牛逼的企业。直到昨天,终于见证历史,登顶美区苹果的 AppStore 应用商店,超越了 ChatGPT。昨晚直接干崩了英伟达、台积电。。然后再回来看,本文会介绍 DeepSeek 的使用技巧,因为它已经

文章图片
#人工智能
大语言模型超参数调整指南:入门调参的实用手册

通过深入分析,我们了解到超参数调优不仅仅是一项技术活动,更是一种艺术。它要求我们对模型有深刻的理解,对数据有敏锐的洞察,以及对目标有清晰的认识。每一次超参数的调整,都像是在与模型进行一场精心设计的对话,旨在引导它更好地服务于我们的愿景。记住,没有一成不变的最佳配置,只有不断探索和适应的最优解。让我们以这篇文章为起点,继续在 AI 的征途上,寻找那些能够点亮智慧之光的超参数组合。

#语言模型#人工智能#机器学习
大模型高考数学测评结果,国内AI大模型成绩超GPT-4o!

现在的大模型都是通用对话型,不再像过去是针对某个非常具体的分类任务设计,所以需要综合地评价模型在不同方面的能力。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。所以从测评的角度,高考数学真题真的是非常难得的测试题目,因为高考真题严格保

文章图片
#高考#人工智能#语言模型
AI产品经理入门宝典:零基础全套学习路线,我要悄悄努力,然后卷赢所有人!

AI技术的核心是模仿人类的学习和决策过程,以在特定任务上达到并超越人类的表现。机器学习是实现AI的一种手段,它使计算机能够通过数据学习和改进。在机器学习中,算法通过对大量数据的分析学习,捕捉数据的模式和规律,并用于预测或分类任务。深度学习是机器学习的一个分支,它以人工神经网络为基础,尤其善于处理视觉和语言识别问题。深度学习模型通常需要海量的数据来训练,它可以识别和利用这些数据中的复杂模式。AI产品

文章图片
#人工智能#产品经理#学习
大模型学习路径:八本精华书籍助力职业生涯,一篇文章全掌握!非常详细收藏我这一篇就够了

如果你想深入了解大模型领域,无论是为了学术研究还是实际应用,选择合适的书籍是非常重要的。以下是精选的八本大模型相关书籍,涵盖了从基础理论到高级实践的内容,可以帮助你构建全面的知识体系。《大模型应用开发极简入门》作者:未知简介:这本书适合初学者快速入门大模型应用开发。书中提供了大量的实例和练习,帮助读者理解和掌握大模型的基本概念和技术要点。特色:语言通俗易懂,注重实践操作。《大模型时代:ChatGP

文章图片
#学习#人工智能
运维转行大模型全攻略:史上最全总结,非常详细,收藏这一篇就够了!

运维心里苦谁做谁知道,有时候感觉自己像一个杂工,在公司都快变成一个修电脑的了,不装了我转行了,给大家分享一点经验,希望能帮助到你们。运维工程师转行至大模型领域需要学习一系列新的技能和知识。以下是一个详细的转行攻略,帮助您从运维工程师转向大模型领域:了解基础知识:数学基础:学习线性代数、概率论、统计学和微积分等基本数学知识,这些是大模型领域的基础。编程语言:如果您已经熟悉Python,这是一个好的开

文章图片
#运维#学习#语言模型
    共 181 条
  • 1
  • 2
  • 3
  • 19
  • 请选择