上医不二个人主页

@scixue

上医不二

2024-10-07 07:31:36 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

初代大模型RNN/LSTM全解三：工具兴衰启示录

《RNN/LSTM生产力工具的发展与更替（2015-2018）》摘要：本文系统回顾了基于RNN/LSTM架构的生产力工具在2016年前后的突破性应用。谷歌神经机器翻译系统（GNMT）通过8层LSTM架构将翻译错误率降低60%，证明了深度学习在工业场景的可行性；LSTM语音识别技术则在移动设备实现49%错误率下降，推动智能助手普及。专业领域中，LSTM在金融预测、库存管理等时间序列分析任务展现潜力。

#人工智能 #rnn #lstm +1

大模型参数深度解析二：透视文本大模型——从千亿参数到“智能效率”的新平衡

2026年大语言模型参数效率解析：从Transformer到MoE架构演进本文深入剖析大语言模型的参数组织原理与计算逻辑。首先拆解经典Transformer架构参数构成，揭示12×L×d²+V×d的核心公式，解释为何前馈网络是参数大户。重点分析2026年主流MoE架构的范式转变，阐明总参数量与激活参数量的关键区别（如Qwen3.5总参3970亿仅激活170亿）。提供四步评估法指导模型选型，指出当

#人工智能

大模型参数深度解析一：嵌入模型的“沉默参数”，如何支撑起整个智能时代？

摘要：嵌入模型作为AI生态系统的关键技术，将非结构化数据转化为高维向量，支撑检索、推荐等核心应用。本文从参数视角解析嵌入模型，揭示其设计逻辑与性能边界：84%参数集中于Transformer编码器层，专注于语义理解而非生成；对比学习取代MLM成为主流训练范式，优化向量空间几何性质；维度选择、池化策略等设计影响模型效能。2026年趋势包括多模态统一嵌入、长上下文优化及与MoE架构协同。选型需权衡任

#人工智能

Headless无头模式全景解析:AI时代的基础设施范式

《无头架构：AI时代的解耦哲学与技术演进》本文从计算机科学思想史视角剖析无头架构的本质与发展。硬件时代服务器与终端的分离、Web领域内容与样式的解耦、电商业务能力与交互流程的拆分，共同构成了"解耦"思想的演进脉络。随着AIAgent成为新交互界面，API-first设计成为AI友好系统的核心要求，推动无头架构从可选方案升级为基础设施范式。文章通过分析无头浏览器技术栈的迭代（P

#人工智能

Transformer深度解析四：认知跃迁、交互建模与文明基底重构

《超越Transformer：智能范式的未来迁徙》摘要（2026年3月）本文探讨Transformer架构的认知边界与智能形态的进化方向。当前基于符号关联的AI存在三大局限：缺乏物理世界理解、静态知识体系及模拟推理能力。未来智能将沿三个方向突破：1）具身交互，通过多模态数据构建可验证的物理模型；2）因果推理，融合神经网络与符号逻辑实现可解释决策；3）终身学习，发展类生物的自适应进化能力。最终，智

#人工智能

RAG深度解析四：从检索增强到认知伙伴——知识自主时代的未来推演与人文叩问

《RAG技术终极形态：从知识检索到认知伙伴的范式革命》文章探讨了RAG（检索增强生成）技术未来可能的发展方向，认为其终极形态将超越当前的技术路线之争，实现知识自主流动与智能涌现。核心观点包括：1）各技术流派将融合为动态知识构建体系，检索行为从目标降格为手段；2）知识存在形式可能从显式存储演变为"潜在知识场"或实时协商的"模型上下文协议"；3）系统功能将从被

#人工智能 #机器学习 #算法

RAG深度解析三：向量数据库工具箱的演进、选型与生产力实践

《向量数据库演进史：从学术工具到生产力核心》 2026年的技术格局中，向量数据库已从"学术玩具"成长为RAG等AI应用的关键基础设施。本文梳理了其发展脉络：早期混沌期（2020-2022）通过魔改关系型数据库或封装Faiss探索可行性；专用化战争阶段（2022-2024）涌现出Milvus、Qdrant等专用方案；当前（2024-2026）则进入融合期，传统数据库（如Postg

#数据库 #人工智能

RAG深度解析二：2026年创业浪潮中的核心赛道与生存指南

2026年RAG技术已成为AI创业的核心基础，推动四大核心赛道发展：垂直行业智能体解决方案（需深度嵌入工作流）、智能体开发工具（聚焦无代码和运维平台）、个人助理（功能优先而非平台化）以及数字蓝领自动化（结合RAG与RPA）。当前市场更看重商业价值而非技术新奇性，创业者需警惕中间层陷阱，注重行业专精和产品体验。不同背景的创业者应选择匹配自身优势的细分领域，如行业专家深耕垂直场景，技术团队关注运维监控

#人工智能

Transformer深度解析三：2026年大模型引擎的工具革命与生态更迭

2026年大模型工具生态全景：从提示词到生产部署的实战指南本文系统梳理了2026年Transformer大模型工具生态的演进与现状。文章揭示了大模型使用范式从早期"提示词技巧"到"程序化编排"，再到当前"编译与优化"的三次跃迁，指出工具演进的主线是"从艺术到科学"。重点分析了四大核心场景的主流工具：提示词开发（Cur

#人工智能

RAG深度解析一：从参数化知识到检索增强的范式重构

摘要：本文深入解析2026年检索增强生成(RAG)技术的核心原理，揭示其如何重构大语言模型的概率框架。RAG通过引入检索上下文变量，将生成过程转化为联合概率模型，实现从"闭卷生成"到"开卷检索"的范式转变。文章详细拆解了RAG三大技术支柱：语义向量嵌入、近似最近邻索引和注意力融合机制，并阐述了系统架构从基础流水线到模块化智能体的演进路径。RAG作为连接静态知

#人工智能

共 24 条

请选择