logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

本地太卡?Ollama云模型:无需显卡,轻松运行百亿参数大模型!看到就是赚到,建议收藏!!

Ollama云模型功能解决了本地硬件不足的问题,允许用户在云端运行大模型而不受本地显卡限制。使用方法简单,只需登录账号并添加'-cloud'后缀即可运行支持的超大模型。云模型不占用本地资源,适合电脑配置较低或需要运行大模型的场景,但需注意网络延迟和API密钥安全。目前处于免费预览期,未来可能按调用计费,是个人开发者和轻量部署的理想选择。

文章图片
#人工智能
3 个令人惊艳的 DeepSeek 项目,诞生了!

开年以来 DeepSeek 热度一直居高不下,这周更是连续每天开源一个项目,持续推动整个 AI 行业的发展。待 DeepSeek 所有项目发布后,我们会在公众号上汇总分享,大家可保持关注。在此期间,GitHub 作为全球开发者聚集地,很多个人开发者也纷纷基于 DeepSeek 构建实用的 AI 工具并开源。

文章图片
#人工智能#语言模型#DeepSeek
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型

vLLM(Virtual Large Language Model)是由加州大学伯克利分校团队开发的高性能大模型推理框架,其核心特点围绕显存优化、高吞吐量、灵活性和易用性展开。对比 ollama 作为个人开发者部署模型工具而言,vLLM 专注于高并发请求和大规模生产环境,适用于企业级应用和需要高效推理的场景。vLLM 通过优化内存管理和并发处理,适合处理高负载的生产环境 ‌。

文章图片
#人工智能#DeepSeek
2026 年刚开年,独立开发者圈子就炸锅了!法国独立开发者 Marc Lou 年入103万美元!普通人应如何实践?

法国独立开发者Marc Lou用AI工具实现年入103万美元的案例,揭示了独立开发领域的新可能。通过25个项目快速试错、构建产品矩阵与交叉推广策略,他证明了在AI赋能下,个人开发者也能创造商业奇迹。本文深度拆解其成功路径,并对比国内外开发生态,为想要入局的普通人提供实战建议。

文章图片
#人工智能#前端#前端框架
RTX4060低成本搭建集群本地部署Deepseek-R1,收藏这一篇就够了!!

使用4台RTX 4060搭建集群运行大模型:方案与细节在AI大模型时代,即使是资源有限的个人开发者或小型团队,也可以通过合理搭建集群来运行大模型。本文将详细介绍使用4台RTX 4060(8GB显存)+32GB内存+i5-12400的机器组成集群运行大模型的可行性方案和技术细节。

#人工智能#语言模型
微调大模型成本降低96%?LoRA技术让个人开发者也能玩转大模型微调!

LoRA技术通过矩阵分解原理,将微调参数量减少96%,仅需学习两个小矩阵而非全参数。这种方法大幅降低显存占用和训练成本,使个人开发者也能负担大模型微调。LoRA在保持接近全量微调效果的同时,避免灾难性遗忘,并支持可插拔式技能包切换,是参数高效微调(PEFT)的代表技术。

文章图片
#服务器#数据库#transformer +2
多智能体架构完全指南:从单一智能体到提升90.2%性能的架构设计

本文详细解析了大模型应用中的多智能体架构选择策略,介绍了四种核心模式:子智能体、技能、交接和路由器,分别适用于不同场景。研究显示,恰当的多智能体架构可提升90.2%性能。文章通过对比各架构在分布式开发、并行化、多跳交互和直接用户交互方面的表现,帮助开发者根据需求选择最优架构。建议从单一智能体开始,仅在遇到上下文管理和分布式开发限制时才升级到多智能体系统。

文章图片
#架构#人工智能
大模型代理推理完全指南:从被动预测到主动行动的范式转变

本文探讨了大语言模型从静态推理向代理推理的范式转变,提出Agentic Reasoning三大层级:基础能力、自我进化和群体智能。分析了In-context和Post-training两条技术路线,介绍了Agent在科学发现、编程等领域的应用,指出未来AI竞争力在于构建强大的Agentic Loop——让AI能在环境中生存、记忆、反思和协作的系统设计。

文章图片
#人工智能#AI#科技
深度智能体开发实战:基于LangChain与LangGraph的Python实现

本文系统介绍深度智能体的构建方法,涵盖其核心概念、架构组件及与LangChain、LangGraph的区别。深度智能体具备任务规划、上下文管理、子智能体机制和长期记忆能力,可处理复杂多步骤任务。文章提供了完整的Python实现代码和开发最佳实践,帮助开发者构建具备长期推理能力的智能体应用。

文章图片
#人工智能#算法#AI
RAG完全指南:从嵌入到查询改写的五大核心技术(收藏必学)

本文详细介绍了RAG(检索增强生成)技术的五大核心概念:嵌入(文本向量化表示)、切片(文档拆分为小块)、相似度(计算文本相关性)、重排模型(优化检索结果排序)和查询改写(提高检索准确性)。RAG技术使大模型能访问外部知识库,突破静态数据限制,减少幻觉现象,并能提供信息来源引用,提升AI响应的可信度和可验证性,特别适用于对准确性要求高的场景

文章图片
#人工智能#算法#AI
    共 1354 条
  • 1
  • 2
  • 3
  • 136
  • 请选择