
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了两种调用DeepSeek大语言模型API的方式:1) 通过LangChain的ChatOpenAI封装实现,支持JSON格式返回和重试机制;2) 直接使用OpenAI客户端调用。文章重点展示了新闻分类任务的实现方案,包括提示词工程、模型预测封装和评估流程。通过构建包含10个新闻类别的分类系统,实现了从文本预处理、模型调用到性能评估的完整流程,评估指标包含准确率、精确率和F1分数。该方案采

GPT系列模型演进历程:从GPT-1的单向生成到ChatGPT的人类价值对齐。OpenAI通过四年技术迭代,最终在GPT-3基础上引入RLHF(人类反馈强化学习),使ChatGPT具备更符合人类预期的对话能力。核心技术包括:Transformer架构、SparseAttention、Few-shot学习等。主流开源大模型方面,Meta的LLaMA、阿里的Qwen、清华的ChatGLM和深度求索的D

本文详细记录了从零实现基于GPT-2的中文医疗对话机器人的全过程。主要内容包括:1)数据处理阶段采用[CLS]Q[SEP]A[SEP]格式构建对话样本;2)模型训练策略使用梯度累积、学习率预热等技术;3)推理生成采用Top-K采样和重复惩罚机制;4)对话管理维护3轮历史上下文。项目实现了1.1亿参数的医疗对话模型,并提供了完整的Web部署方案。文章深入解析了GPT-2底层原理,分享了梯度累积、采样

Coze(扣子)是字节跳动推出的AI智能体开发平台,定位为“字节版GPTs”,核心价值是零代码、可视化搭建AI智能体。平台提供插件库(搜索、天气、企查查等)、工作流(拖拽式编排)、知识库(RAG检索)、数据库(结构化存储)等核心功能,支持多模态(文生图、语音合成、视频生成)和Multi-Agent多智能体协作。用户通过配置提示词、添加工作流即可创建智能体,一键发布到飞书、微信、抖音等渠道。同时提供

《智能体Agent:从思考到行动的AI进化》 Agent是新一代人工智能助手,它突破传统聊天机器人的局限,具备自主规划、调用工具和执行任务的能力。Agent的核心架构由大模型大脑、记忆系统和工具库组成,能够将复杂任务拆解为可执行步骤,并通过调用计算器、搜索引擎等外部工具完成任务。其工作流程包含任务规划、工具选择、行动执行和结果反思等环节,支持多Agent间的标准化协作。随着MCP工具协议和A2A交

《基于LangGraph的智能体开发实战指南》摘要 本文系统介绍了使用LangGraph框架开发智能体的完整方法。首先讲解了智能体的核心架构(大脑、感知、行动和记忆模块),以及LangGraph的图结构计算模型优势。通过"冲咖啡"案例详细演示了流程控制、状态管理和人工介入的实现方式。重点阐述了六种智能体构建模式:提示链(分步处理)、分支(条件路由)、并行化(效率优化)、计划-执

摘要:本文系统介绍了循环神经网络(RNN)的核心知识与应用。首先讲解了RNN的基本概念、序列数据特点及主要应用场景(如文本生成、机器翻译等)。重点剖析了词嵌入层的作用和RNN的工作原理,包括向量表示、语义保持和时序依赖捕捉。通过PyTorch代码示例展示了Embedding层和RNN层的API使用方法。最后以AI歌词生成为例,详细演示了从数据预处理、模型构建到训练预测的全流程,并总结了RNN在维度

本文介绍了神经网络的基本原理与优化方法。主要内容包括:1)神经网络模型构建,包括神经元计算(线性加权+非线性激活)和层级结构设计;2)激活函数的选择策略,隐藏层推荐ReLU,输出层根据任务类型选择Sigmoid或Softmax;3)参数初始化方法,如Kaiming和Xavier初始化;4)损失函数设计,包括分类任务中的交叉熵损失和回归任务中的SmoothL1损失;5)优化方法,重点介绍了动量法、自

摘要:本文系统介绍了循环神经网络(RNN)及其变体LSTM和GRU。RNN通过隐藏状态传递序列信息,适用于文本、语音等时序数据,但存在梯度消失问题。LSTM通过遗忘门、输入门和输出门控制信息流,能有效捕捉长距离依赖。GRU简化了LSTM结构,合并为更新门和重置门,在保持性能的同时提高效率。文章详细分析了各模型的结构特点、参数配置及适用场景,并通过PyTorch代码示例展示了具体实现方法。









