孙军超个人主页

@sjc212

孙军超

2024-12-05 11:54:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

《向量数据库系列二》非结构化数据转如何化为向量数据？

非结构化数据转化为向量的核心是“用模型提取核心特征，再编码为数值数组文本靠“语义模型”捕捉语义，图像靠“视觉模型”捕捉视觉特征，音频/视频靠“时空模型”捕捉声波/帧间变化；最终输出的向量，其“数值距离”直接对应原始数据的“相似性”——这也是向量数据库能实现“相似性检索”的基础。实际应用中，无需重复开发模型，可直接使用开源工具（如Hugging Face、PyTorch Vision）或云服务商AP

#人工智能 #大数据 #机器学习

Elasticsearch 与 OpenSearch 对比及选择建议

如果你的业务对查询性能要求极高，且需要丰富的高级功能和成熟的社区支持，Elasticsearch 是更好的选择。但如果你注重开源许可证的灵活性，希望与 AWS 服务无缝集成，并且对成本敏感，OpenSearch 是一个值得考虑的替代方案。在做出最终决策之前，建议根据你的具体业务需求和技术栈进行深入评估和测试，以确保选择的搜索引擎能够满足当前和未来的业务发展需要。

#elasticsearch #搜索引擎 #全文检索 +2

集中搜索系统-联邦搜索方案

文章探讨了如何通过“联邦搜索架构+分层权限控制”模式实现集团对多分公司搜索系统的集中化管理，同时满足个性化需求。联邦搜索通过统一接口查询多个独立数据源，无需集中存储数据，适用于数据分散、敏感或异构的场景。其核心特点包括多源异构数据整合、实时性、数据零拷贝和统一权限控制。技术架构分为数据源层、查询协调层、数据整合层和展示层。典型应用场景包括企业内部跨系统搜索、敏感数据查询和多租户SaaS平台。联邦搜

#elasticsearch #全文检索 #开发语言 +1

《向量数据库系列一》什么是向量数据库？向量数据库可以做什么？

向量数据库（Vector Database）是专门用于存储、管理、检索“向量数据”的数据库系统，其本质是为解决“非结构化数据的高效相似性匹配”而生，而非传统数据库的“结构化数据精确查询”。什么是向量数据？向量（Vector）是用一组“数值”表示非结构化数据（如文本、图片、音频、视频）特征的“数学形态”。例如：一张猫的图片，会被转化为（长度可能是128维、512维甚至数千维）的向量，向量中每个数值都

#数据库 #人工智能 #机器学习 +4

大模型的参数是什么？核心解析与本质拆解

训练数据 = “它读的书”（原始知识来源）；参数 = “它从书里总结的知识规律”（隐形规则库）；回答问题/生成内容 = “它用规律解决新问题”（规则的实际应用）。简言之，参数是大模型“智能”的真正来源——这些看不见的数值，决定了模型能理解多少知识、能处理多少复杂任务。下次使用大模型时不妨联想：它给出的每一个回答，背后都是无数“数字配方”在精准计算。

#人工智能 #机器学习 #神经网络 +3

《向量数据库系列二》非结构化数据转如何化为向量数据？

#人工智能 #大数据 #机器学习

大模型的微调和RAG分别是什么，有什么区别

大模型微调（Fine-Tuning）基于已训练好的大模型（如GPT-3.5、Llama 3），用特定领域的小数据集（如医疗病历、法律条文）继续训练，调整模型的部分或全部参数，让模型“记住”该领域的知识、适配特定任务（如医疗问答、法律文书生成）。修改模型的“内在参数”，让知识成为模型的“本能”。大模型的参数是什么？核心解析与本质拆解RAG（Retrieval-Augmented Generation

#人工智能 #机器学习 #深度学习

基于能力网关的 MCP 架构设计与实践：客户端、网关与服务端的协同机制

MCP 协议通过标准化 “大模型客户端 - 能力网关 - 外部工具服务端” 的交互逻辑，解决了大模型调用外部工具的碎片化与安全问题，尤其在管理信息域等需严格权限管控的场景中价值显著。未来，随着大模型与企业业务的深度融合，MCP 协议可进一步扩展 “多模态工具调用”（如调用管理信息域的报表生成工具）、“智能权限推荐”（基于用户场景自动匹配最小权限），成为企业级大模型工具调用的核心标准。

#人工智能 #语言模型 #python

《向量数据库系列二》非结构化数据转如何化为向量数据？

#人工智能 #大数据 #机器学习

Model Context Protocol (MCP)：大模型与外部系统的标准化桥梁

MCP（Model Context Protocol）是大模型安全调用外部工具的标准化协议，旨在解决当前大模型面临的静态知识局限、工具调用碎片化和企业级落地障碍等问题。MCP基于JSON-RPC 2.0，通过标准化的请求-响应模式实现大模型与外部工具的安全交互，核心功能包括工具发现、调用和流式响应。其设计强调安全控制（如权限验证、沙箱执行和审计日志）与开放兼容性，显著降低工具集成成本。相比传统方案

#python #人工智能 #语言模型

共 11 条

请选择