
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
计算机视觉Opencv实验合集——实验二:特征匹配
基于Opecv库的实验,建立场景和具体操作,帮助小伙伴更进一步理解和上手Opencv的方法

计算机视觉Opencv实验合集——实验一:图像修复
基于Opecv库的实验,建立场景和具体操作,帮助小伙伴更进一步理解和上手Opencv的方法
动手学大模型(第二天)
Build a Large Language Model (From Scratch) 中文版

自己动手学大模型(第六天)
动手学大模型(第六天)

【langchain使用指南】如何从模型返回结构化数据
LangChain集成了多种国内外AI模型,但功能支持程度不同。国外主流模型如Anthropic、MistralAI等通常支持工具调用、结构化输出等高级功能,而国内模型需要单独查阅文档确认。使用前需安装对应包(如langchain-google-genai或langchain-deepseek),并通过环境变量设置API密钥。例如,调用谷歌Gemini需设置GOOGLE_API_KEY,调用Dee
中国大学生计算机设计大赛—人工智能实践赛赛道—赛后感想
2023年第16届中国大学生计算机设计大赛—人工智能实践赛赛道—赛后感想

机器学习实战第一天:LSTM(长短时记忆网络)
机器学习实战第一天:LSTM(长短时记忆网络

自己动手学大模型(第七天)
自己动手学大模型(第七天)

自己动手学大模型(第六天)
动手学大模型(第六天)

自己动手学大模型(第五天)
5.6 本章摘要在之前的章节中,我们实现了数据采样、注意力机制,并编写了 LLM 的架构。本章的核心是实现训练函数并对 LLM 进行预训练,详见图 5.1。如图5.1所示,我们将继续学习基本的模型评估技术,以衡量生成文本的质量,这对于在训练过程中优化 LLM 是非常必要的。此外,我们将讨论如何加载预训练权重,以便为接下来的微调提供坚实的基础。在大语言模型(LLM)和其他深度学习模型中,权重指的是可







