logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

核心大模型基础(LLM)

大语言模型(LLM)技术概要 大语言模型(如GPT-3/4)基于Transformer架构,通过海量数据预训练和微调实现文本生成、推理等能力。核心概念包括:Token(文本处理单元)、上下文窗口(记忆长度)、涌现能力(参数达阈值后突现的新能力)及提示工程(优化输入引导输出)。关键技术涵盖自监督学习、思维链推理(CoT)和检索增强生成(RAG)。应用场景广泛,但存在幻觉、知识时效性等风险。开源模型(

文章图片
#人工智能
核心大模型基础(LLM)

大语言模型(LLM)技术概要 大语言模型(如GPT-3/4)基于Transformer架构,通过海量数据预训练和微调实现文本生成、推理等能力。核心概念包括:Token(文本处理单元)、上下文窗口(记忆长度)、涌现能力(参数达阈值后突现的新能力)及提示工程(优化输入引导输出)。关键技术涵盖自监督学习、思维链推理(CoT)和检索增强生成(RAG)。应用场景广泛,但存在幻觉、知识时效性等风险。开源模型(

#人工智能
保姆级Claude Code安装(WIN版本-极速版)

本文介绍了ClaudeCode终端AI编程助手的安装与配置流程:1)通过PowerShell使用winget命令安装;2)解决权限问题后重启终端;3)通过修改.claude.json配置文件绕过地区限制;4)配置国内模型API地址和密钥;5)测试运行。文章特别提到可使用Kimi提供的免费额度进行体验,提供了从安装到实际使用的完整指引。(149字)

到底了