ju7ran 个人主页

@ju7ran

ju7ran

2023-04-18 16:54:27 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

GitHub 一周热点榜

GitHub本周AI开源热点纷呈：图像生成模型Flex 2带来4款基础模型和1个VAE，支持多图参考和4K超清；腾讯推出轻量级视频生成框架Huiyuan Video 1.5，仅需14GB显存；智能体记忆系统Colony结合向量搜索和图数据库，提供长期记忆能力。此外还有Mac经典Launchpad的开源复刻工具LaunchNext、自托管笔记系统Note Discovery以及Nginx可视化神器N

#github #人工智能 #transformer +2

GitHub 一周热点榜

#github #人工智能 #transformer +2

MCP与数据库的完美结合

《MCP+数据库：AI精准检索结构化数据的新方案》摘要：针对传统RAG技术在知识检索中的四大痛点（检索精度不足、切片信息不全、时效性差、多轮查询弱），本文提出MCP+数据库的创新方案。MCP（模型上下文协议）作为AI工具调用的统一标准，通过标准化接口实现模型与结构化数据库的直接交互。以MongoDB为例，MCP支持模型直接执行SQL查询，在复杂查询、关联查询等场景下展现出远超RAG的精准度。实测

#数据库

MCP与数据库的完美结合

#数据库

神经网络参数计算：小学生都能看懂的AI训练原理

摘要：神经网络训练的核心原理是通过调整参数（W、B）使预测值接近真实值，使用损失函数（如均方误差）量化误差。简单情况下可直接求解（如线性回归），复杂网络则采用梯度下降法：随机初始化参数后，计算梯度并沿最陡方向逐步调整。神经网络的多层结构通过链式法则计算各层参数的梯度，这一反向传播过程从前向计算输出开始，反向推算各层梯度并更新参数，循环迭代直至损失最小化。整个过程就像从山顶一步步试探着走到最低点。

#人工智能 #神经网络 #深度学习 +1

RAG、In-Context Learning、微调:如何选择最适合你的AI技术方案?

AI技术选型指南：RAG、In-Context Learning与Fine-tuning的对比与应用本文深入分析了三种主流AI技术方案的差异与适用场景： RAG（检索增强生成）：适用于模型能力足够但缺乏背景知识的场景，适合处理动态更新的外部数据，但需注意检索质量和知识库更新问题 In-Context Learning：通过Prompt示例激发模型能力，适合快速验证和小规模应用，但Prompt过长

#人工智能 #分布式 #transformer +1

史上最全大型语言模型LLM介绍

摘要大型语言模型(LLM)是能理解和生成人类语言的AI模型，参数量通常达数百亿以上。GPT、LLaMA等国外模型和文心一言等国内模型是典型代表。LLM发展经历了统计学习、深度学习到Transformer架构的演进，模型规模扩大带来了"涌现能力"。常见LLM包括OpenAI的GPT系列（最新GPT-5实现多模态融合）、Anthropic的Claude系列（最新Claude 4.

#语言模型 #人工智能 #自然语言处理 +1

最新版LangChain 1.0快速入门介绍

LangChain 1.0重大更新概述 LangChain 1.0版本进行了全面升级，致力于简化开发流程并提升生产环境的稳定性。主要更新包括：架构革新：以智能体(Agent)为核心，取代旧版的链式结构，通过统一的create_agent()API简化开发底层优化：将LangGraph作为底层运行时，继承其状态管理、持久化等生产级能力关键新特性：引入中间件机制，支持全流程干预标准化消息格式

#深度学习 #人工智能 #transformer

最新版LangChain 1.0快速入门介绍

#深度学习 #人工智能 #transformer

Prompt Engineering 和微调，到底该选谁？

摘要：本文探讨了大模型应用中的关键决策问题——何时选择Prompt工程，何时需要微调。研究表明，80%的场景通过Prompt优化+RAG+CoT即可满足需求。微调适用于四种特殊情况：高度专业化领域、Prompt优化已达瓶颈、拥有高质量标注数据或需要低延迟响应。文章提供了五步决策流程：1)判断任务通用性；2)梯度优化Prompt；3)叠加RAG/CoT工具；4)对比不同基座模型；5)评估是否满足微调

#人工智能 #语言模型 #自然语言处理 +1

共 174 条

请选择