梦想画家个人主页

@neweastsun

梦想画家

2022-06-23 14:59:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

使用sys_refcursor和临时表返回oracle结果集

sys_refcursor是oracle9i以后系统定义的一个refcursor,主要用在过程中返回结果集。如果仅仅为了返回值，无需自己在包头中定义游标类型，只需直接使用sys_refcursor即可轻松返回结果。但如果返回结果需要中间计算，就需要临时表进行存储，最后返回。示例代码说明，简单明了。

#oracle

告别关键词！PostgreSQL+pgvector 玩转语义和图像检索

在 AI 驱动的语义检索时代，传统关键词搜索已难以满足“理解内容”的需求。pgvector 作为 PostgreSQL 的向量扩展，让数据库具备了高效的向量存储与检索能力，无需额外部署独立向量数据库，极大简化了架构。本文结合实战场景，从环境搭建、文本转向量模型选型（BERT vs BGE）、数据处理、索引优化到最终检索实现，完整拆解 pgvector 的应用流程，并通过可直接运行的 Python

#postgresql #数据库

实战优化：基于 pgvector 的向量存储与检索效率提升全攻略

本文以企业级大文件（如万字文档、PDF）语义检索场景为实战案例，从 pgvector 字段设计、大文件分割策略、向量精度优化、数据库表结构设计四个核心维度，系统拆解如何在不损失计算精度的前提下，同步实现存储空间压缩 30%+、检索效率提升 5 倍+的优化路径。文中所有方案均配套可直接落地的代码示例与真实测试数据，无缝适配生产环境部署需求。

#postgresql

Smile — Java 生态中最被低估的机器学习框架

在 Java 生态中做机器学习，选择其实不多。Weka 太老、DL4J 太重、Mahout 要搭 Hadoop。但有一个库，功能全、性能好、API 优雅，却很少有人提起——Smile (Statistical Machine Intelligence & Learning Engine)。这个月初（2026年5月4日），Smile 发布了 6.1.0 版本，代码库已经非常成熟。本文从实战出发，带你

#机器学习

破局数据孤岛：制造业基于 Trino 与统一元数据构建灵活数据资产底座

在智能制造转型的深水区，制造企业正面临严峻的“数据烟囱”困境。ERP中的订单数据、MES里的生产工序、IoT平台的海量传感器时序数据以及质检系统记录，往往分散在数十种异构系统中。传统ETL模式不仅耗时费力，还极易产生数据副本与一致性风险。面对这一痛点，采用“存算分离、零数据移动”的 Trino 分布式查询引擎，配合统一的元数据管理平台（如 Apache Gravitino），正成为制造企业破局的关

用SQL驱动AI：Trino AI Functions跨源情报分析实战指南

本文介绍了一种将AI能力无缝集成到数据湖仓分析流程的创新架构。通过Trino AI Functions，数据分析师无需离开熟悉的SQL环境，即可对湖仓中的多源数据进行情感分析、实体提取、文本生成等AI处理。文章详细解析了7个核心AI函数的功能，并重点演示了如何通过SQL拼接多源数据构建Prompt，实现跨S3湖仓与PostgreSQL的“跨源情报简报”生成。这种“SQL组装、AI执行”的模式，极大

#sql

Java HashMap中的compute及相关方法详解：从基础到Kafka Stream应用

HashMap是Java集合框架中最常用的数据结构之一，它提供了高效的键值对存储和检索功能。在Java 8中，HashMap引入了一系列新的原子性更新方法，包括`compute()`、`computeIfAbsent()`和`computeIfPresent()`等，这些方法极大地简化了在Map中进行复杂更新操作的代码。本文将详细介绍这些方法，包括它们的用法、示例和实际应用场景，并特别探讨它们在K

Faust 实战：Python 流处理利器与实时数据管道构建指南

在实时数据处理需求激增的今天（如用户行为分析、物联网设备监控、金融交易流处理），开发者亟需一个**高性能、易扩展且与 Python 生态无缝集成**的流处理工具。Google 团队开源的 **Faust** 应运而生——它基于 Apache Kafka 和 Python 的 `asyncio`，将复杂的流处理逻辑简化为“装饰器+异步函数”的直观写法，支持**实时数据分析、事件驱动架构、微服务通信*

#python #kafka

数据集标注与标签化：提升大语言模型性能的关键技术

本文将深入探讨数据集标注与标签化的**技术背景**（为什么需要它们？）、**核心作用**（如何提升模型性能？）、**典型应用场景**（从情感分析到信息抽取），并通过**文本分类、命名实体识别（NER）、关系抽取**等任务的Python代码示例，展示如何高效构建高质量的标注数据集，最后总结最佳实践，助力开发者打造高性能的LLM应用。

#语言模型 #人工智能 #大数据

LangGraph 实战：基于外部数据库条件触发工作流执行

本文聚焦“外部数据库查询结果符合条件时触发工作流”这一核心实战需求，系统阐述实现原理、分步落地流程、可直接复用的完整代码示例，并针对生产环境的稳定性、可扩展性需求提供进阶优化方案，帮助开发者快速掌握 LangGraph 与外部数据库的集成技巧，高效实现自动化、智能化的工作流触发与执行。

共 282 条

请选择