
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
延续传统高效的商业化应用优势,加快AI大模型应用落地;机遇: 数字经济发展、企业降本增效需求、人口老龄化劳动力要素替代机遇、AI大模型技术发展处于国际领先地位、高效的产品商业化应用落地速度、稳定、积极向上的政商环境、资金支持。其他趋势: 模型轻量化助力终端智能化,AI大模型将反哺基础科学技术的发展,基础AI通用大模型将开源化赋能构建国产软件生态。行业应用: AI大模型在金融、政务、医疗、电商和教育

「RAG 技术通过在 AI 生成过程中引入外部知识检索,从基础的文档查询发展到多模态、Multi-Agent 体协同的智能架构,让 AI 回答更准确、更全面」

Transformer模型已成为AI发展的主要驱动力。然而,对Transformer训练的理解仍然有限。一个引人注目的现象是,Transformer的训练在很大程度上依赖于Adam优化器,相比之下,随机梯度下降与动量(SGD)在Transformer上的表现明显不如Adam(例如,见图3)。但是,造成这种性能差距的原因仍不清楚。

谷歌最近发布了 Gemini 2.0 Flash 版本模型,这可能是当前性价比最高的 AI 模型了。这个模型除了性价比之外,还有何魔力呢?为什么我会说 RAG 即将被淘汰呢?

在默认设置下,你需要在终端中和大模型进行交互,虽然这是个不错的选择,但看着一长串代码和黑色背景,实在有些沉闷。如果你也觉得如此,不妨试试Open WebUI,这个工具可以给你带来更现代化的操作体验。

DeepSeek-R1在Introduction部分提到,R1通过结合冷启动数据、多阶段训练管道和纯强化学习,显著提升了大型语言模型的推理能力,实现了与OpenAI的o1系列模型相当的性能,并通过蒸馏技术将推理能力传递给更小的模型。

RAG 就像我们做开卷考试,在回答考题之前,先翻我们准备的资料(通过检索相关文档来增强自己的能力),这样一来,答题不仅更准确,还能带上更多上下文信息,显得更有深度和针对性。

近期有个需求,服务器不能联网,需要本地私有化用docker部署一套AI知识库系统,技术选型如下:FastGPT: FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景。

谷歌最近发布了 Gemma 3,这是其开源模型家族的最新版本,为 AI 行业带来了深远的创新。Gemma 3 凭借多模态处理能力、庞大的上下文窗口和增强的语言支持,标志着大型语言模型 (LLM) 发展的重要里程碑。该模型的开源特性为开发者和研究人员提供了前所未有的机会,可以在各种应用场景中探索和利用先进的 AI 能力。

AI “幻觉”指的是大语言模型(LLM)在缺乏真实依据的情况下生成不准确、误导性甚至完全虚构的内容。其幻觉现象源于模型架构的局限性以及基于概率的生成方式的限制。尽管它们目前无法被完全消除,但理解幻觉产生的原因为有效的缓解提供了基础。本篇文章来自 Emil Sorensen(kapa.ai 创始人&CEO)的最新博客,他在文章中重点探讨了 AI 幻觉产生的原因、减少幻觉的技术策略,以及最新的研究进展








