logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

卷积神经网络提取人脸五个特征点

与分类任务的核心差异:分类任务标签为“类别整数”,回归任务标签为“10个连续坐标值”,需将标签转为浮点型(与模型输出数据类型匹配)。标签文件格式(train.txt/test.txt):每行11个元素,第一个为图片相对路径,后10个为坐标值,示例:000001.jpg 32 28 48 29 39 45 30 52 48 51self.imgs = [] # 存储图片完整路径self.labels

#cnn#kotlin#人工智能
OpenCV实战:透视变换原理与发票矫正全解析

透视变换(Perspective Transformation)通过数学矩阵映射,将图像从“透视视角”转换为“正交视角”,本质是利用3×3变换矩阵M,实现像素坐标的非线性映射,解决倾斜拍摄导致的畸变问题。透视变换的核心逻辑可概括为“找4点→排顺序→求矩阵→做变换”:先通过轮廓检测获取目标物体4个顶点,按固定规则排序保证坐标标准化,再通过OpenCV接口求解变换矩阵并执行矫正,最终得到无畸变图像。

#opencv#人工智能#计算机视觉
仅通过提示词用豆包实现项目:爬虫+神经网络对目标图片分类

提示词工程不是“堆砌需求”,而是“精准传递意图”的艺术。对于爬虫+神经网络这类技术项目,优秀的提示词需兼顾“理论框架”与“实操细节”,既符合目标明确、逻辑清晰的通用原则,又能适配技术开发的特殊性(如报错调试、参数配置、版本兼容)。通过本文的案例复盘可见,从模糊需求到完整项目,提示词的迭代过程也是需求逐步清晰、问题逐个解决的过程。掌握本文的提示词条件与模板,能让你在AI驱动开发中更高效地落地技术项目

#爬虫#神经网络#分类
基于OpenCV的银行卡号识别项目实战

本项目核心目标是自动识别银行卡表面的卡号,整体流程分为两大模块:一是创建数字模板库,通过对标准OCR-A(一种便于机器识别的字体)数字模板图像的处理,提取0-9每个数字的轮廓特征并保存;二是对银行卡图像进行预处理、轮廓检测定位卡号区域,再通过模板匹配识别每个数字,最终输出卡号及银行卡类型。技术栈:Python + OpenCV + NumPy,无需复杂的深度学习模型,仅通过传统计算机视觉技术即可实

#opencv#人工智能#计算机视觉
基于TF-IDF完成《红楼梦》关键词提取(制作搜索引擎)

本文基于TF-IDF算法,完整实现了“关键词提取+章节搜索”的轻量级搜索引擎,核心亮点:配置化设计:所有参数集中管理,可快速适配其他文本数据集;中文优化:加载专属词库和停用词库,提升分词和关键词提取准确性;交互友好:支持多关键词搜索,提供清晰的结果反馈和退出机制。该方案无需复杂模型,计算高效,适合小型文本库的检索场景(如小说、论文集、文档库等)。

机器学习开篇

利用数学公式总结出数据中的规律来解决实际问题。

#机器学习#人工智能
基于python的网络爬虫

以ua伪装为例:ua即urser agent(用户代理):指客户端(如浏览器、手机 App、爬虫程序)向服务器发送请求时,附带的一段 “身份标识字符串”,用于告诉服务器 “我是什么设备 / 程序”。如下图,ua伪装通过获取网页内容时添加头文件中ua的伪装实现反反爬。伪装身份在哪里找:以获取浏览器访问百度的ua为例:浏览器打开百度,鼠标右击选择检查 ,选择网络,选择第一项双击进入,刚进来不会显示ua

#爬虫
到底了