
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
知识理解子类"观察记忆": "知识理解", "概括理解": "知识理解", "说明论证": "知识理解",# 表达交流子类"经历经验": "表达交流", "主观看法": "表达交流", "情感态度": "表达交流",# 实践应用子类"分析计算": "实践应用", "推测解释": "实践应用", "简单问题解决": "实践应用",# 创造迁移子类"综合问题解决": "创造迁移", "猜想探究": "
在课堂教学评价、教学数据分析场景中,课堂教学视频的语音转写、文本结构化是核心刚需。传统手动转写效率极低,且纯转写文本存在识别噪声、角色错乱、无教学活动标注等问题,无法直接适配后续 CV/NLP 教学分析系统。本文基于 Python 实战开发一款课堂视频自动化处理工具。
LlamaFactory 是一个开源的大语言模型(LLM)微调框架,主要特点:1、核心功能:- 统一微调平台:支持 100+ 种大模型(LLaMA、Qwen、Mistral、ChatGLM 等)- 多种训练方法:全参数微调、LoRA、QLoRA、DoRA 等- 多任务支持:预训练、指令微调(SFT)、奖励模型训练、RLHF、DPO 等2、主要优势:- 易用性高:提供 Web UI(LlamaBoa
与分类任务的核心差异:分类任务标签为“类别整数”,回归任务标签为“10个连续坐标值”,需将标签转为浮点型(与模型输出数据类型匹配)。标签文件格式(train.txt/test.txt):每行11个元素,第一个为图片相对路径,后10个为坐标值,示例:000001.jpg 32 28 48 29 39 45 30 52 48 51self.imgs = [] # 存储图片完整路径self.labels
其实回顾两张图片的结构差异,就能明白循环神经网络的进化逻辑:RNN解决了“神经网络能否有记忆”的问题,而LSTM解决了“如何让记忆更持久、更精准”的问题。对于我们AI应用开发工程师来说,理解它们的原理,不仅能帮我们在项目中快速选对模型(比如短文本用RNN省资源,长文本用LSTM保效果),更能为后续学习GRU(LSTM的简化版)、Transformer(当前NLP的主流模型)打下基础——毕竟,所有复
基础层(形态学):通过腐蚀、膨胀等简单操作,完成图像的初步预处理(去噪、修复),提取最基础的轮廓特征,为后续精准提取打基础。进阶层(Sobel边缘检测):通过人工设计的卷积核,实现更精准的边缘提取,解决形态学梯度运算精度不足的问题,是传统特征提取的核心工具。深度学习层(CNN):将传统算法的“人工设计核”升级为“数据驱动可学习核”,浅层提取类似Sobel的简单特征,中层组合成复杂特征(如部件),深
今天介绍卷积神经网络调优的方法,包括学习率调度器,残差网络结构等,以我们前面实现的食物分类项目为例。在食物分类任务中:手动搭建的卷积神经网络(CNN)要么训练收敛缓慢、准确率卡在瓶颈,要么随着网络层数加深,准确率不升反降。这两个核心问题,恰恰对应CNN调优中最关键的两个方向——学习率调度和退化问题解决。本文将聚焦这两大板块,结合食物分类的实际场景,拆解调优逻辑、提供实操代码,帮你快速突破准确率瓶颈
核心能力:封装自定义工具(文本字数计算),结合记忆模块,实现带上下文的结构化工具调用。# 1. 自定义工具name = "文本字数计算工具"description = "当需要计算文本的字数时,使用此工具"# 2. 工具列表与提示词# 3. 记忆模块(保留对话上下文)# 4. 初始化Agent并执行# 调用示例agent_executor.invoke({"input": "'我是一个非常聪明的人
提示词工程不是“堆砌需求”,而是“精准传递意图”的艺术。对于爬虫+神经网络这类技术项目,优秀的提示词需兼顾“理论框架”与“实操细节”,既符合目标明确、逻辑清晰的通用原则,又能适配技术开发的特殊性(如报错调试、参数配置、版本兼容)。通过本文的案例复盘可见,从模糊需求到完整项目,提示词的迭代过程也是需求逐步清晰、问题逐个解决的过程。掌握本文的提示词条件与模板,能让你在AI驱动开发中更高效地落地技术项目
在计算机视觉实战中,将风格迁移与物体追踪结合可实现更具视觉冲击力的效果。本文基于OpenCV,从原理到代码逐模块拆解,最终实现“实时风格迁移+目标追踪”的融合方案,全程聚焦实操,不堆砌冗余理论。







