logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

vscode中调用deepseek实现AI辅助编程

大家好我是费老师,最近国产大模型新版本凭借其优秀的模型推理能力,讨论度非常之高🔥,且其官网提供的相关大模型API接口服务价格一直走的“价格屠夫”路线,性价比很高,本期文章中,就将为大家举例,如何在vscode中,基于开源AI编程辅助插件Continue,配置基于Deepseek的API接口,实现常用的AI编程辅助等功能。

#vscode#ide#编辑器
开源项目:纯Python构建的中后台管理系统

来源:Python大数据分析 费弗里大家好我是费老师,目前市面上有很多开源的解决方案,复杂如那种前端基于Vue,后端基于Java的框架,虽然其提供了较为完善的一整套前后端分离权限管理系统解决方案,但如果想要深入进行,还是需要学习相关的基础,使用到,有着不小的学习和使用门槛。而今天要给大家推荐的系统项目,则是一套搞定和的快速开发框架,使用及改造非常的,功能全面对标并加以拓展,你只需要会Python,

#python
我常用的一个电商数据采集软件,低代码爬虫

最近DeepSeek大火,对话质量之高一度超过ChatGPT、Claude等主流海外模型。你知道什么决定了大模型训练结果的好坏吗?除了算法外,训练数据的质和量起着决定性作用,而很多AI公司用到的训练数据就是利用爬虫技术从全网抓取的,这也是OpenAI、Anthropic等公司的核心竞争力。

#爬虫
推荐7个适合跨境电商&外贸数据采集的爬虫工具

亮数据平台提供了强大的数据采集工具,比如Web Scraper IDE、亮数据浏览器、SERP API等,能够自动化地从网站上抓取所需数据,无需分析目标平台的接口,直接使用亮数据提供的方案即可安全稳定地获取数据。在当今数据驱动的时代,自动化爬虫工具和软件成为了许多企业和个人获取数据的重要手段,特别是跨境电商、外贸等业务,对数据的需求非常大,比如对amazon、tiktok、shopee等网站数据的

#自动化#爬虫#运维
pdfkit | 利用python实现html文件转pdf

在用jupyter notebook写代码文档的时候,有时需要导出pdf版本,但jupyter会报错。我在想,除了网上的debug方法,还没有其他方案可以生成pdf。度娘搜了下,很多博客推荐Python的第三方库pdfkit,可以将生成pdf文件。其实也有很多软件提供pdf生成服务,但这样太不python了,那下面就来试试pdfkit怎么用吧!

文章图片
#python#html
性能碾压pandas、polars的数据分析神器来了

为例,直接在终端中执行下列命令,我们就一步到位的完成了对应演示虚拟环境的创建,并在环境中完成了。等常见格式的文件,我们首先使用下列代码生成具有五百万行记录的简单示例数据,并分别导出为。具有极强的单机数据分析性能表现,功能丰富,具有诸多拓展插件,且除了默认的。就在几天前,经过六年多的持续开发迭代,著名的开源高性能分析型数据库。中使用非常的灵活方便,今天的文章,费老师我就将带大家一起快速了解。作为一款

#pandas#数据分析#数据挖掘
python的包管理器uv可以替代conda吗?

搞数据和算法的把conda当宝贝,其他的场景能替代。Python的包管理器有很多,pip是原配,uv是后起之秀,conda则主打数据科学。uv替代pip似乎只是时间问题了,它能做pip所有能做的事,不光可以作为包管理器,还能管理虚拟环境,而且比pip更快。而且快的不是一丢丢,你随便安装个pandas试试,uv几乎是pip速度的几十倍。

#python#uv#conda
收藏!使用Python读写Excel大数据文件的3种有效方式

Python处理Excel大数据有很多方式,不过Excel撑死才104万行,能有多大的数据,一般用pandas读取就可以,pandas有专门的分块读取模式,比如说每次只读取1万行用于处理,这样就不会太占用内存。另外一个可以大规模写入数据,不占用内存的是库是XlsxWriter,它有个“常量内存”模式,支持每写入一行,就在内存中清除上一行占用的空间,意味着内存只存有一行数据,永远是够用的。OpenP

#python#开发语言
低代码爬虫利器,搭建Youtube视频监测平台,有点强~

聊到大模型,他说他现在在做一个舆情监测的多模态大模型,专门对Youtube进行采集训练,作为世界上最大的媒体平台,自然有最丰富、最及时、最真实的用户内容,但是数据采集是个难题,因为现在的自动化爬虫多到令人发指,Youtube的反爬机制异常严格。3、抓取浏览器:这是专门用于网页抓取的远程浏览器, 和普通浏览器类似,可以模拟高级用户交互,比如如点击、滚动、登录),它的优势是能通过单一 API接口提供无

#低代码#爬虫#音视频
我常用的7个数据采集工具,适合新手爬虫

它提供了自动网站解锁功能,能够应对动态加载、验证码、IP限制等各种反爬虫机制,而且支持如Puppeteer、Playwright和Selenium等多种爬虫工具,在亮数据内置的无界面浏览器上进行数据的采集,成功率非常高。不管是文本、图片、视频亦或表格,八爪鱼都能抓,而且它还提供了非常丰富的采集模板,比如电商、新闻、短视频等主流平台全包含,它已经帮你配置好了流程,一键可以实现爬虫。它的优势是基于Py

#爬虫
    共 306 条
  • 1
  • 2
  • 3
  • 31
  • 请选择