十年饮冰的吴同学个人主页

@qq_33137873

十年饮冰的吴同学

2023-06-27 15:29:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

向量数据库之Lancedb学习记录

Lancedb是一个用于人工智能的开源矢量数据库，旨在存储、管理、查询和检索大规模多模式数据的嵌入。Lancedb的核心是用Rust编写的，并构建在Lance之上，专为高性能 ML 工作负载和快速随机访问而设计。

#数据库 #学习 #人工智能 +3

PandaAI：使用自然语言进行数据分析的利器

PandaAI是一个典型的Text2SQL智能体，核心原理是利用大模型将自然语言查询转换为可执行的代码，通过封装的.chat方法，将问题、表头和 5-10 行数据传递给大模型，然后由模型生成最相关的代码（Python 或 SQL），同时生成的代码在本地执行，并把产生的结果按照最符合问题的形式进行返回。基本上所有的Text2SQL都大同小异，而PandaAI额外支持了一些数据预处理的方法和自动选择特

#数据分析 #人工智能 #数据挖掘

Qwen2.5-VL：更强大的多模态大模型｜附实测结果

这版模型增强了对于文档的解析和问答效果，可以一定程度上替代OCR模型的使用，也具备关键信息提取的能力，同时能够实现格式化输出。表格解析和文档解析可能会有丢失格式的情况，在文档解析中，原始文档中的图片是没法复原的。这个过程可能也与提示词有关，或者需要多轮交互让模型输出正确的样式。

#人工智能 #开源 #语言模型 +1

Agent架构新方向？Claude Skills工作原理解析

是 Claude 提供的一种可扩展机制。每个 Skill 本质上是一个文件夹，包含元数据、说明文档以及可选的代码脚本和资源文件。这些技能仅在需要时才会被加载，使 Claude 在执行特定任务时具备专门的知识和流程。与传统一次性提示不同，Skills 通过渐进式披露的方式工作：Claude 会在会话开始时扫描所有技能的元数据，包括名称和简要描述，将其作为系统提示的一部分，而这部分代价极低，通常几十个

#架构 #chrome #人工智能 +1

零基础小白也行，只用一行命令在自己的电脑跑大模型

目前该项目更新非常快，从路线图看后期还会支持更多模型和功能。相比于研究更强大的模型，减少技术的使用门槛对于普通人来说，显得更有实际意义。

#人工智能 #语言模型

Qwen2.5-VL：更强大的多模态大模型｜附实测结果

#人工智能 #开源 #语言模型 +1

深度智能体框架DeepAgent剖析

DeepAgent将自己定位为，它本质上仍是工具调用循环，但集成了让智能体深度思考的核心能力。与传统框架不同，DeepAgent通过内置工具和能力，让开发者专注于业务逻辑，而非基础设施搭建。字典配置"description": "用于深度研究复杂问题","system_prompt": "你是一个专业的研究助手，擅长多步骤信息收集和综合","model": "openai:gpt-4o", # 可

#人工智能

RAG的另一种思路，基于文档树结构的推理型检索

与传统RAG相比，PageIndex的结构更加轻量。它不依赖复杂的向量数据库，而是以树状结构将文档组织为可解析的JSON文件，大幅降低了部署难度和成本。同时，它保留了文档的自然上下文，避免了人工分块造成的语义破碎，使得信息在检索时更连贯、更准确。PageIndex的核心优势在于推理型检索。通过让LLM沿树结构逐层推理，它能够找到真正相关的内容，而非仅仅语义相似的段落。每次检索的结果都附带完整的推理

#人工智能 #语言模型 #架构

一文看懂现役最强开源模型Qwen3

感觉本次Qwen3最大的亮点就是模型原生支持思考模式和非思考模式，可以根据不同的任务需要选择不同的模式，无需跟往常一样同时部署推理模型和对话模型，一个模型即可搞定所有工作。思考模式：在这种模式下，模型会逐步推理，适合需要深入思考的复杂问题。非思考模式：在此模式中，模型提供快速、近乎即时的响应，适用简单问题。

#人工智能 #开源 #语言模型

告别RAG上下文丢失：Late Chunking 与 Contextual Retrieval 深度对比解析

Late Chunking和Contextual Retrieval都为传统分块方法中固有的上下文丢失问题提供了各自的解决方案：● Late Chunking 采用“先嵌入后分块”的方式，在多个分块之间保留语义信息，利用的是模型结构的特点，不会造成额外的消耗；● Contextual Retrieval 则基于LLM为每个分块添加文档范围的上下文信息进行增强，会造成大量的token损耗，同时效

#人工智能 #开源 #数据挖掘

共 35 条

请选择