
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Lancedb是一个用于人工智能的开源矢量数据库,旨在存储、管理、查询和检索大规模多模式数据的嵌入。Lancedb的核心是用Rust编写的,并构建在Lance之上,专为高性能 ML 工作负载和快速随机访问而设计。

PandaAI是一个典型的Text2SQL智能体,核心原理是利用大模型将自然语言查询转换为可执行的代码,通过封装的.chat方法,将问题、表头和 5-10 行数据传递给大模型,然后由模型生成最相关的代码(Python 或 SQL),同时生成的代码在本地执行,并把产生的结果按照最符合问题的形式进行返回。基本上所有的Text2SQL都大同小异,而PandaAI额外支持了一些数据预处理的方法和自动选择特

这版模型增强了对于文档的解析和问答效果,可以一定程度上替代OCR模型的使用,也具备关键信息提取的能力,同时能够实现格式化输出。表格解析和文档解析可能会有丢失格式的情况,在文档解析中,原始文档中的图片是没法复原的。这个过程可能也与提示词有关,或者需要多轮交互让模型输出正确的样式。

是 Claude 提供的一种可扩展机制。每个 Skill 本质上是一个文件夹,包含元数据、说明文档以及可选的代码脚本和资源文件。这些技能仅在需要时才会被加载,使 Claude 在执行特定任务时具备专门的知识和流程。与传统一次性提示不同,Skills 通过渐进式披露的方式工作:Claude 会在会话开始时扫描所有技能的元数据,包括名称和简要描述,将其作为系统提示的一部分,而这部分代价极低,通常几十个
目前该项目更新非常快,从路线图看后期还会支持更多模型和功能。相比于研究更强大的模型,减少技术的使用门槛对于普通人来说,显得更有实际意义。

这版模型增强了对于文档的解析和问答效果,可以一定程度上替代OCR模型的使用,也具备关键信息提取的能力,同时能够实现格式化输出。表格解析和文档解析可能会有丢失格式的情况,在文档解析中,原始文档中的图片是没法复原的。这个过程可能也与提示词有关,或者需要多轮交互让模型输出正确的样式。

DeepAgent将自己定位为,它本质上仍是工具调用循环,但集成了让智能体深度思考的核心能力。与传统框架不同,DeepAgent通过内置工具和能力,让开发者专注于业务逻辑,而非基础设施搭建。字典配置"description": "用于深度研究复杂问题","system_prompt": "你是一个专业的研究助手,擅长多步骤信息收集和综合","model": "openai:gpt-4o", # 可
与传统RAG相比,PageIndex的结构更加轻量。它不依赖复杂的向量数据库,而是以树状结构将文档组织为可解析的JSON文件,大幅降低了部署难度和成本。同时,它保留了文档的自然上下文,避免了人工分块造成的语义破碎,使得信息在检索时更连贯、更准确。PageIndex的核心优势在于推理型检索。通过让LLM沿树结构逐层推理,它能够找到真正相关的内容,而非仅仅语义相似的段落。每次检索的结果都附带完整的推理
感觉本次Qwen3最大的亮点就是模型原生支持思考模式和非思考模式,可以根据不同的任务需要选择不同的模式,无需跟往常一样同时部署推理模型和对话模型,一个模型即可搞定所有工作。思考模式:在这种模式下,模型会逐步推理,适合需要深入思考的复杂问题。非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用简单问题。
Late Chunking和Contextual Retrieval都为传统分块方法中固有的上下文丢失问题提供了各自的解决方案:● Late Chunking 采用“先嵌入后分块”的方式 ,在多个分块之间保留语义信息,利用的是模型结构的特点,不会造成额外的消耗;● Contextual Retrieval 则基于LLM为每个分块添加文档范围的上下文信息进行增强 ,会造成大量的token损耗,同时效








