logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

狂降75%!大模型DeepSeek-V3.2 API杀疯了:性能零衰减的秘密,藏在DSA这两大“黑科技”里

摘要: DeepSeek-V3.2-Exp大模型通过自研的DSA稀疏注意力机制(含“闪电索引器”和“稀疏MLA”两大核心技术),将长文本处理的计算复杂度从O(L²)降至O(Lk),实现效率飞跃。其“先筛选后计算”的协同工作流程(投影-评分-选择-计算)在保证性能零衰减的同时,使API调用成本狂降75%,尤其擅长法律、医疗等长文本场景。该技术突破标志着国产大模型在自研创新与商业普惠上的平衡,为行业提

文章图片
#大数据#人工智能#自然语言处理 +1
大模型RAG项目实战:阿里巴巴GTE向量模型

阿里巴巴GTE向量模型是一种基于多阶段对比学习的通用句向量模型,在中文语义向量评测基准C-MTEB上表现优异。该模型采用Transformer编码器,通过预训练和微调两阶段训练,使用改进的对比损失函数处理大规模文本数据(预训练数据近8亿文本对)。GTE模型支持文本聚类、相似度计算等下游任务,可通过ModelScope框架快速调用。针对特定领域效果不足的问题,用户可基于自有数据微调模型。文中提供了模

文章图片
#人工智能#机器学习#milvus +3
从0到1搞懂DeepSeek大模型领域微调!医疗/法律案例实测提升40%+,解决显存不足/过拟合等8大痛点

DeepSeek领域微调不是“高深技术”,而是“有章法的实战”——从数据准备(保证质量)、模型选择(匹配任务)、参数配置(平衡效果与资源),到部署监控(持续迭代),每一步都有明确的“目标”和“避坑点”。文中医疗、法律案例证明,只需数千条数据、普通GPU,就能让模型性能提升20%-40%,真正实现“通用模型”到“领域专家”的跨越。无论你是AI新手还是行业开发者,跟着这套流程走,都能快速落地DeepS

文章图片
#人工智能#机器学习#python +1
0基础入门AI智能体,Coze与Dify怎么选?从定位到实操的全方位对比

文章对比分析了AI智能体开发平台Coze与Dify的核心差异: 定位差异:Coze(字节系)主打零门槛可视化开发,适合轻量化应用;Dify(开源)专注全流程企业级开发,支持私有部署。 优势对比:Coze强在生态整合与多模态交互,Dify胜在模型兼容性与RAG知识管理。 适用人群:0基础建议从Coze入门,技术进阶或企业需求优先选Dify。 关键短板:Coze存在并发限制与生态依赖,Dify需技术基

文章图片
#人工智能#AI
大模型RAG项目实战:Milvus向量数据库

Milvus是一款云原生向量数据库,专为海量非结构化数据的向量检索设计。它采用存储计算分离架构,支持高并发、高吞吐的向量相似度搜索,能在秒级完成十亿级数据检索。核心特性包括高性能索引、混合查询(向量+标量)、水平扩展及开发者友好的多语言支持。系统分为接入层、协调服务、执行节点和存储层,通过ETCD、Pulsar/MinIO等组件实现元数据管理、消息持久化和对象存储。作为大模型时代处理Embeddi

#milvus#数据库#推荐算法 +4
0基础也能懂!Ollama保姆级教程:Windows/mac/Linux/Docker全系统安装,搭配Open WebUI玩转本地大模型

摘要: Ollama作为开源轻量的大模型运行框架,让普通电脑(8GB内存+6GB显存)也能本地运行Llama 3.3、DeepSeek-R1等热门模型。本文提供多系统(Windows/macOS/Linux/Docker)安装指南,附具体命令和避坑方法,0基础用户也能快速上手。Ollama支持模型量化、跨平台部署和自动化管理,通过简单命令即可下载、运行和管理模型。搭配Open WebUI还能实现可

文章图片
#windows#macos#linux +2
2025 AI Agent行业深度拆解:DeepSeek降本3%破推理壁垒,Manus开通用闭环,从技术到商业的全景指南

摘要: 2025年,AI Agent(智能体)在DeepSeek-R1开源模型(推理成本降至OpenAI的3%)和通用智能体Manus(实现任务自主闭环)的推动下,从实验室迈向产业应用。AI Agent的核心是PPA架构(感知-规划-行动),具备自主决策与执行能力,区别于传统大模型的被动响应。技术突破方面,DeepSeek-R1通过强化学习提升推理能力并降低成本,Manus验证了多智能体协同的工程

文章图片
#人工智能#DeepSeek
零门槛搞定大模型+Ollama+Open-WebUI!3种安装方法全拆解,小白10分钟上手本地AI助手

摘要: 本文详细介绍了在本地部署Ollama+Open-WebUI的三种方法(Python pip、源码编译、Docker容器),帮助用户快速搭建大模型AI助手。Ollama负责运行本地大模型(如Llama 3),Open-WebUI提供交互界面。安装前需确保系统满足硬件和软件要求,并注意网络问题。三种安装方式各有侧重,小白用户推荐Python pip安装,进阶用户可选源码或Docker。文章还提

文章图片
#人工智能#AIGC#神经网络 +1
DeepSeek 微调实践:DeepSeek-R1 大模型基于 MS-Swift 框架部署 / 推理 / 微调实践大全

本文介绍了基于MS-Swift框架的DeepSeek-R1大模型的部署、推理与微调实践。DeepSeek-R1是一款专为推理优化的语言模型,结合MS-Swift框架可实现高效部署。文章详细讲解了环境配置、模型下载、vLLM加速部署等步骤,并通过实例展示了API调用和本地推理操作。此外,还提供了使用LoRA方法进行模型微调的完整流程,包括数据集准备和训练参数设置。该技术方案平衡了性能与资源消耗,为开

文章图片
#人工智能#python#AIGC
具身智能机器人终于有了 “三维大脑”!3D-VLA 破解动态场景推理难题,动作误差仅 0.02m

3D-VLA模型突破了传统二维视觉-语言-行动(VLA)模型的局限,首次将三维感知、动态场景推理与机器人行动规划深度融合。该模型通过3D大模型架构、交互Tokens机制及具身扩散模型,实现了语言指令→三维场景预测→精确动作生成的闭环,行动误差仅0.02米。其创新点包括:从二维数据中提取三维信息构建百万级数据集,结合ChatGPT生成语言标注;利用扩散模型预测动态场景变化,指导机器人适应真实环境。开

文章图片
#机器人#3d#人工智能 +1
    共 159 条
  • 1
  • 2
  • 3
  • 16
  • 请选择