logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习实战-基于卷积神经网络CNN的水果图像分类识别模型

本文介绍了一个基于卷积神经网络(CNN)的水果图像分类项目。使用Kaggle提供的22495张水果/蔬菜图像(33个类别)作为数据集,通过数据预处理、图像增强等技术优化数据质量。构建的CNN模型包含4个卷积模块和全连接层,采用Adam优化器和交叉熵损失函数进行训练。实验结果显示,模型在验证集上达到98.51%的准确率,F1-score接近1.00,表明该模型能有效识别不同水果类别。该项目展示了深度

文章图片
#深度学习#cnn#python +2
数据挖掘实战-基于Random Forest的血细胞异常检测模型

本文基于Kaggle血细胞异常检测数据集,利用机器学习方法构建了血细胞异常识别模型。研究采用包含19种细胞类型的5880条记录,涵盖形态学特征、颜色信息和临床指标等36项特征。通过随机森林、梯度提升树和逻辑回归模型对比实验,结果显示随机森林表现最优,二分类任务AUC达0.9971,准确率97.02%;多分类任务准确率95.92%。特征分析表明细胞直径、面积等形态学特征最具判别力。该模型为临床血细胞

文章图片
#数据挖掘#随机森林#信息可视化 +2
ChatGPT:深度学习和机器学习的知识桥梁

ChatGPT,即“Chat Generative Pre-trained Transformer”,是一种基于深度学习的自然语言处理模型,由OpenAI开发。这个模型的独特之处在于它的能力,可以生成自然、流畅的文本,仿佛是来自一个有思维的聊天伙伴。ChatGPT的工作原理基于Transformer架构,这是一种在自然语言处理领域取得巨大成功的架构。

文章图片
#人工智能#深度学习#python
企业级招聘数据采集实战:基于 Bright Data AI Studio 的自动化爬虫方案

本文介绍了如何使用BrightData AIStudio平台高效采集招聘网站数据。文章首先分析了传统爬虫在招聘数据采集中面临的IP封禁、反爬机制等痛点问题,随后详细展示了AIStudio的核心功能:通过AI自动生成爬虫、云端托管运行环境、内置代理与解封机制、API化交付等企业级解决方案。

文章图片
#python#爬虫#自动化 +1
企业级招聘数据采集实战:基于 Bright Data AI Studio 的自动化爬虫方案

本文介绍了如何使用BrightData AIStudio平台高效采集招聘网站数据。文章首先分析了传统爬虫在招聘数据采集中面临的IP封禁、反爬机制等痛点问题,随后详细展示了AIStudio的核心功能:通过AI自动生成爬虫、云端托管运行环境、内置代理与解封机制、API化交付等企业级解决方案。

文章图片
#python#爬虫#自动化 +1
AI 也能写爬虫?基于 Bright Data + Warp CLI 的网页抓取实战

爬虫的成功与否,往往和代码本身关系不大。对于一个真实网站来说,是否能抓到数据,取决于一整套运行环境,包括但不限于:请求来源是否可信(IP、地理位置、信誉)是否存在频率限制和行为检测是否启用了验证码、JS 渲染或动态加载是否对自动化行为进行识别和拦截生成一段逻辑上合理的抓取代码。它无法:为你提供稳定、干净的出口 IP帮你绕过真实世界中的反爬机制在请求被拦截时自动切换策略这也是为什么很多“AI 写爬虫

文章图片
#python#爬虫
Python深度学习“四大名著”之一全新PyTorch版

本书是一本全面介绍在PyTorch环境下学习机器学习和深度学习的综合指南,可以作为初学者的入门教程,也可以作为读者开发机器学习项目时的参考书。本书讲解清晰、示例生动,深入介绍了机器学习方法的基础知识,不仅提供了构建机器学习模型的说明,而且提供了构建机器学习模型和解决实际问题的基本准则。本书添加了基于PyTorch的深度学习内容,介绍了新版Scikit-Learn。本书涵盖了多种用于文本和图像分类的

文章图片
#python#机器学习#人工智能 +2
百度智能云“千帆大模型平台”升级:大模型最多,Prompt模板最全

当谈到人工智能领域时,我们不得不提到ChatGPT。许多人都在积极尝试利用它来提高工作效率或解决各种问题。然而,要使用ChatGPT,我们必须克服一些使用门槛。首先,我们需要“科学上网”才能访问它,其次,GPT4的价格相对较高。值得庆幸的是,国内也有一些优秀的大模型平台供我们使用。与ChatGPT相比,这些平台的价格更为经济实惠,而且不需要像“科学上网”这样的额外准备。更重要的是,它们支持的功能也

文章图片
#百度#python
AI 也能写爬虫?基于 Bright Data + Warp CLI 的网页抓取实战

爬虫的成功与否,往往和代码本身关系不大。对于一个真实网站来说,是否能抓到数据,取决于一整套运行环境,包括但不限于:请求来源是否可信(IP、地理位置、信誉)是否存在频率限制和行为检测是否启用了验证码、JS 渲染或动态加载是否对自动化行为进行识别和拦截生成一段逻辑上合理的抓取代码。它无法:为你提供稳定、干净的出口 IP帮你绕过真实世界中的反爬机制在请求被拦截时自动切换策略这也是为什么很多“AI 写爬虫

文章图片
#python#爬虫
基于 Bright Data AI Studio 的自动化采集实战

回顾整个实践过程,可以发现一个非常清晰的结论:在房地产这样高反爬、高价值、长周期的数据场景中,决定成败的往往并不是爬虫技巧本身,而是采集系统是否具备“企业级稳定运行”的基础条件。这也是很多团队在项目初期容易忽略、但在中后期一定会面对的现实问题。

文章图片
#爬虫
    共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择