logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深入理解 Apache Dagster:数据管道编排实战指南

Apache Dagster 通过声明式 API、模块化架构和强大的可观测性工具,显著提升了数据管道的可维护性与可靠性。本文从环境搭建到高级功能演示,系统展示了其核心能力。对于需要处理复杂数据依赖、追求开发效率的团队,Dagster 提供了现代数据工程所需的基础设施。建议结合官方文档深入探索其与 dbt、Spark 等生态的集成,进一步释放其潜力。

文章图片
GitHub Actions 入门指南:从零开始自动化你的开发流程

GitHub Actions 是 GitHub 提供的强大自动化工具,它允许开发者在代码仓库中直接定义、构建和执行工作流程。本文将带你深入了解 GitHub Actions 的核心概念,包括工作流(Workflows)、事件(Events)、任务(Jobs)和运行器(Runners),并通过详细的步骤指导你如何在仓库中创建和配置 GitHub Actions。我们还将通过四个实用的示例——Node

文章图片
#github#自动化#运维
Golang解析CSV文件

Golang解析CSV文件日常工作实用CSV类型文件很普遍,而且很容易从其他数据源中获得。如Google Sheets,Microsoft Excel,或关系型数据库。如何在应用中加载并解析CSV呢,本文带你实用Golang解析csv文件。1. 概述通常其他语言处理CSV文件比较麻烦,通常需要通过第三方库,解析工作量较大。Golang中内置了encoding/csv包,让解析工作变得很简单。假设我

Python 三种方式实现自动化任务

本文介绍了用Python实现机器人过程自动化的三个包,方便读者选择、对比学习。

文章图片
#python#自动化
累积分布函数与概率密度函数的区别

本文简要介绍统计学中PDF (probability density function) 和 CDF (cumulative distribution function) 之间的差异。随机变量再讨论PDF 和 CDF之前,我们首先需要理解随机变量。随机变量通常用x表示,表示一些随机过程中产生的数值类型结果,分为两类:离散和连续。离散随机变量离散随机变量(discrete random variab

文章图片
Python嵌套函数详解:封装逻辑的实用技巧

作用域限制:只能在定义它的函数内部调用访问权限:可访问外部函数的变量封装性:适合封装辅助功能print("内部函数")inner()outer() # 正常执行# inner() # 会报错,外部无法调用更清晰的代码封装更灵活的功能实现更优雅的设计模式建议从闭包和装饰器开始实践,逐步掌握这一强大特性。对于特别复杂的场景,可考虑使用类来替代深层嵌套结构,保持代码可维护性。

文章图片
#python
LangChain:Agent & Tools 实战案例

在LangChain中,“Agent”是一个与各种“Tool”交互以执行任务或回答查询的AI实体。工具本质上是通过允许代理执行特定操作(如检索当前时间或访问外部数据库)来扩展代理功能。在LangChain中创建代理的基本代码包括定义工具、加载提示模板和初始化语言模型。然后使用AgentExecutor执行代理,该代理管理代理与工具之间的交互。这种设置允许动态和上下文感知响应,使AI能够以结构化的方

文章图片
LangGraph系列-2:用Tools增强聊天机器人

在开发聊天机器人时,必须认识到,可能存在仅基于其现有知识无法回答的问题。通过集成外部tools,聊天机器人可以搜索网页或访问外部api来检索实时信息或相关数据,从而提升用户体验。本教程将主要关注如何利用LangGraph预构建的ToolNode进行工具调用,它允许聊天机器人调用这些附加功能。设置好环境后,下一步是定义聊天机器人将用于处理特定查询的工具。在此上下文中,工具可以定义为聊天机器人可以调用

文章图片
Dbt自动化测试实战教程

第三种选择是使用宏自定义宏测试。例如,我们可以将计算结果与来自不同分析的已知值进行比较。在下面的示例代码中,我们计算去年的总营业额,并将其与年度报告中公布的值进行比较。这是典型的数据库回归测试,确保即使在进行了一些修改之后,数据库的完整性仍然保持不变。确保数据符合质量标准可能非常耗时,因为需要运行很多且计算成本高的测试。为了避免延迟向最终用户交付数据的工期,最好定义所谓的“冒烟测试”。

文章图片
Golang:使用DuckDB查询Parquet文件数据

本文介绍DuckDB查询Parquet文件的典型应用场景,掌握DuckDB会让你的产品分析能力更强,相反系统运营成本相对较低。为了示例完整,我也提供了如何使用Python导出MongoDB数据。Apache Parquet文件格式在存储和传输大型数据集方面变得非常流行。最近遇到一个典型应用场景,在MongoDB中存储大量结构化数据的成本过高。相反,我们将这些数据以Parquet格式存储在S3中。为

文章图片
#golang
    共 247 条
  • 1
  • 2
  • 3
  • 25
  • 请选择