logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI大模型与API之间不得不说的二三事

从2016年**Alaph GO**横空出世,再到2022年**ChatGPT**的诞生,以及2025年**DeepSeek**走进中国AI圈,一路爆火,最后到最近的**OpenClaw**,互联网上各种呼声,**“养龙虾”** 这个词,不论年龄大小,从小学生到创业者都在使用。就单说**OpenClaw**,这个**AI Agent**吧,在2026年以来,有政府的创业补贴、国内**AI圈**的生

#人工智能#神经网络#机器学习 +2
浅聊Prompt、向量知识库、RAG

本文介绍了Prompt(提示词)、RAG(检索增强生成)和向量知识库的核心概念与应用。Prompt是与大模型交互的唯一方式,可分为用户Prompt、系统Prompt和检索后的Prompt三类。写好Prompt需要明确指令、步骤和案例,类似指导实习生工作。RAG技术通过在回答问题前进行知识检索来增强生成效果,其核心是构建向量知识库——将资料切片后转换为数学向量存储。调用时通过Embedding模型将

#人工智能
揭秘Transformer架构设计 1

Transformer模型架构解析:从Token到向量空间 Transformer模型彻底改变了NLP领域,其核心由Encoder和Decoder组成,采用自注意力机制替代传统RNN。工作流程分为6个阶段:Tokenization将文本拆分为子词Token;Embedding将Token映射为数学向量;Positional Encoding添加位置信息;Encoder/Decoder深度理解语义;

文章图片
#transformer#深度学习#人工智能 +4
初遇Open AI,深入了解大语言模型训练范式

2025年标志着大模型训练哲学的历史性跨越——传统的"预训练+SFT+RLHF"三段式训练法已被RLVR(可验证奖励强化学习)彻底改写。本文以GPT-3模型和Llama 3.1模型为典型案例,深入探究LLM模型训练范式的核心差异与演进路径。

#人工智能#语言模型#自然语言处理 +1
初探AI世界

人工智能(AI)是通过程序让机器模拟人类思维和行为的计算机技术,可分为弱AI、强AI和超AI三类。大模型是AI的高级形态,经过预训练和微调等过程,具备知识处理和推理能力。AI生态包含大模型开发者、应用开发者和使用者三个角色。AI Agent是具备自主决策和执行能力的智能实体,由大模型、记忆、任务规划和工具使用等组件构成,能通过多Agent协作完成复杂任务。AI技术正深刻影响电商、教育、金融等行业,

#人工智能
到底了