logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hopsworks:面向机器学习团队的开源 AI 数据平台

Hopsworks是一个面向机器学习团队的开源AI数据平台,提供从特征管理到模型部署的全流程解决方案。其核心是特征存储功能,确保训练和推理时的特征一致性,并支持版本管理、血缘追踪等功能。平台支持本地部署和云服务(AWS/Azure/GCP),提供项目级多租户管理、开发工具(Jupyter/Airflow)和完整API文档。采用AGPL-V3协议开源,社区活跃,适合需要统一管理ML工作流的团队使用,

#人工智能#机器学习#开源 +1
新浪微博相册下载器:多线程批量抓取高清原图

本文介绍了一个开源的Python工具"Sina-Weibo-Album-Downloader",它能够通过多线程批量下载新浪微博相册中的高清原图。文章指出该工具解决了微博官方不提供批量下载功能的问题,特别适合备份相册或收集摄影、设计等素材。工具原理简单,仅依赖requests库,通过微博API获取相册列表和图片ID,并发下载原图。使用步骤包括获取用户OID和cookies并运行脚本,图片将自动保存

#新浪微博#其他
PyGWalker:把 pandas DataFrame 变成交互式可视化界面

PyGWalker:将Pandas数据转换为交互式可视化工具 PyGWalker是一个开源的Python库,可将Pandas DataFrame快速转化为类似Tableau的交互式可视化界面。通过简单的两行代码调用,用户可在Jupyter等环境中拖拽字段生成多种图表(柱状图、散点图等),并支持数据筛选、聚合计算及自然语言查询。其特点包括: 高效处理:支持DuckDB引擎,可本地处理100GB数据

#pandas#windows#其他
markitdown:各类文档转 Markdown 的 Python 工具

微软开源的markitdown是一款多功能Python工具,支持将PDF、Word、Excel、图片、音频等15种格式转换为结构化Markdown。该工具专注于为AI文本分析和知识管理保留文档核心结构,提供命令行和API两种调用方式,支持LLM集成与插件扩展。特别适合文档格式统一、知识库建设及AI训练数据准备等场景,具备企业级Azure服务集成能力。项目采用MIT协议,需Python 3.10+环

#python#开发语言#其他
到底了