朱卫军Python 个人主页

@Pydatas

朱卫军Python

2023-08-17 07:33:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

vscode中调用deepseek实现AI辅助编程

大家好我是费老师，最近国产大模型新版本凭借其优秀的模型推理能力，讨论度非常之高🔥，且其官网提供的相关大模型API接口服务价格一直走的“价格屠夫”路线，性价比很高，本期文章中，就将为大家举例，如何在vscode中，基于开源AI编程辅助插件Continue，配置基于Deepseek的API接口，实现常用的AI编程辅助等功能。

#vscode #ide #编辑器

开源项目：纯Python构建的中后台管理系统

来源：Python大数据分析费弗里大家好我是费老师，目前市面上有很多开源的解决方案，复杂如那种前端基于Vue，后端基于Java的框架，虽然其提供了较为完善的一整套前后端分离权限管理系统解决方案，但如果想要深入进行，还是需要学习相关的基础，使用到，有着不小的学习和使用门槛。而今天要给大家推荐的系统项目，则是一套搞定和的快速开发框架，使用及改造非常的，功能全面对标并加以拓展，你只需要会Python，

#python

我常用的一个电商数据采集软件，低代码爬虫

最近DeepSeek大火，对话质量之高一度超过ChatGPT、Claude等主流海外模型。你知道什么决定了大模型训练结果的好坏吗?除了算法外，训练数据的质和量起着决定性作用，而很多AI公司用到的训练数据就是利用爬虫技术从全网抓取的，这也是OpenAI、Anthropic等公司的核心竞争力。

#爬虫

推荐7个适合跨境电商&外贸数据采集的爬虫工具

亮数据平台提供了强大的数据采集工具，比如Web Scraper IDE、亮数据浏览器、SERP API等，能够自动化地从网站上抓取所需数据，无需分析目标平台的接口，直接使用亮数据提供的方案即可安全稳定地获取数据。在当今数据驱动的时代，自动化爬虫工具和软件成为了许多企业和个人获取数据的重要手段，特别是跨境电商、外贸等业务，对数据的需求非常大，比如对amazon、tiktok、shopee等网站数据的

#自动化 #爬虫 #运维

pdfkit | 利用python实现html文件转pdf

在用jupyter notebook写代码文档的时候，有时需要导出pdf版本，但jupyter会报错。我在想，除了网上的debug方法，还没有其他方案可以生成pdf。度娘搜了下，很多博客推荐Python的第三方库pdfkit，可以将生成pdf文件。其实也有很多软件提供pdf生成服务，但这样太不python了，那下面就来试试pdfkit怎么用吧！

#python #html

性能碾压pandas、polars的数据分析神器来了

为例，直接在终端中执行下列命令，我们就一步到位的完成了对应演示虚拟环境的创建，并在环境中完成了。等常见格式的文件，我们首先使用下列代码生成具有五百万行记录的简单示例数据，并分别导出为。具有极强的单机数据分析性能表现，功能丰富，具有诸多拓展插件，且除了默认的。就在几天前，经过六年多的持续开发迭代，著名的开源高性能分析型数据库。中使用非常的灵活方便，今天的文章，费老师我就将带大家一起快速了解。作为一款

#pandas #数据分析 #数据挖掘

python的包管理器uv可以替代conda吗?

搞数据和算法的把conda当宝贝，其他的场景能替代。Python的包管理器有很多，pip是原配，uv是后起之秀，conda则主打数据科学。uv替代pip似乎只是时间问题了，它能做pip所有能做的事，不光可以作为包管理器，还能管理虚拟环境，而且比pip更快。而且快的不是一丢丢，你随便安装个pandas试试，uv几乎是pip速度的几十倍。

#python #uv #conda

收藏！使用Python读写Excel大数据文件的3种有效方式

Python处理Excel大数据有很多方式，不过Excel撑死才104万行，能有多大的数据，一般用pandas读取就可以，pandas有专门的分块读取模式，比如说每次只读取1万行用于处理，这样就不会太占用内存。另外一个可以大规模写入数据，不占用内存的是库是XlsxWriter，它有个“常量内存”模式，支持每写入一行，就在内存中清除上一行占用的空间，意味着内存只存有一行数据，永远是够用的。OpenP

#python #开发语言

低代码爬虫利器，搭建Youtube视频监测平台，有点强~

聊到大模型，他说他现在在做一个舆情监测的多模态大模型，专门对Youtube进行采集训练，作为世界上最大的媒体平台，自然有最丰富、最及时、最真实的用户内容，但是数据采集是个难题，因为现在的自动化爬虫多到令人发指，Youtube的反爬机制异常严格。3、抓取浏览器：这是专门用于网页抓取的远程浏览器，和普通浏览器类似，可以模拟高级用户交互，比如如点击、滚动、登录），它的优势是能通过单一 API接口提供无

#低代码 #爬虫 #音视频

我常用的7个数据采集工具，适合新手爬虫

它提供了自动网站解锁功能，能够应对动态加载、验证码、IP限制等各种反爬虫机制，而且支持如Puppeteer、Playwright和Selenium等多种爬虫工具，在亮数据内置的无界面浏览器上进行数据的采集，成功率非常高。不管是文本、图片、视频亦或表格，八爪鱼都能抓，而且它还提供了非常丰富的采集模板，比如电商、新闻、短视频等主流平台全包含，它已经帮你配置好了流程，一键可以实现爬虫。它的优势是基于Py

#爬虫

共 306 条

请选择