logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型报告】2024年中国AI大模型场景探索及产业应用调研报告【免费下载】

延续传统高效的商业化应用优势,加快AI大模型应用落地;机遇: 数字经济发展、企业降本增效需求、人口老龄化劳动力要素替代机遇、AI大模型技术发展处于国际领先地位、高效的产品商业化应用落地速度、稳定、积极向上的政商环境、资金支持。其他趋势: 模型轻量化助力终端智能化,AI大模型将反哺基础科学技术的发展,基础AI通用大模型将开源化赋能构建国产软件生态。行业应用: AI大模型在金融、政务、医疗、电商和教育

文章图片
#人工智能#语言模型
RAG 架构图解:从基础到高级的7种模式,收藏这一篇就够了!!

「RAG 技术通过在 AI 生成过程中引入外部知识检索,从基础的文档查询发展到多模态、Multi-Agent 体协同的智能架构,让 AI 回答更准确、更全面」

文章图片
#架构#人工智能#语言模型 +1
【AI大模型】为什么Transformer需要Adam?

Transformer模型已成为AI发展的主要驱动力。然而,对Transformer训练的理解仍然有限。一个引人注目的现象是,Transformer的训练在很大程度上依赖于Adam优化器,相比之下,随机梯度下降与动量(SGD)在Transformer上的表现明显不如Adam(例如,见图3)。但是,造成这种性能差距的原因仍不清楚。

文章图片
#人工智能#transformer#语言模型
谷歌放大招!RAG 技术已死?

谷歌最近发布了 Gemini 2.0 Flash 版本模型,这可能是当前性价比最高的 AI 模型了。这个模型除了性价比之外,还有何魔力呢?为什么我会说 RAG 即将被淘汰呢?

文章图片
#人工智能#语言模型#RAG
【搭建AI大模型】从0到1搭建本地大模型,最简单的方法!

在默认设置下,你需要在终端中和大模型进行交互,虽然这是个不错的选择,但看着一长串代码和黑色背景,实在有些沉闷。如果你也觉得如此,不妨试试Open WebUI,这个工具可以给你带来更现代化的操作体验。

文章图片
#人工智能#语言模型
一文搞懂DeepSeek - 强化学习和蒸馏,收藏一篇就够了!!

DeepSeek-R1在Introduction部分提到,R1通过结合冷启动数据、多阶段训练管道和纯强化学习,显著提升了大型语言模型的推理能力,实现了与OpenAI的o1系列模型相当的性能,并通过蒸馏技术将推理能力传递给更小的模型。

文章图片
#人工智能#语言模型#DeepSeek
大模型私有知识库如何提高准确率?切块是关键,看完这一篇你就懂了!!

RAG 就像我们做开卷考试,在回答考题之前,先翻我们准备的资料(通过检索相关文档来增强自己的能力),这样一来,答题不仅更准确,还能带上更多上下文信息,显得更有深度和针对性。

文章图片
#人工智能#语言模型
AI知识库本地Docker部署--Docker部署LLM大语言模型glm-4-9b-chat

近期有个需求,服务器不能联网,需要本地私有化用docker部署一套AI知识库系统,技术选型如下:FastGPT: FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景。

文章图片
#人工智能#docker#语言模型
多模态大模型新标杆!Gemma 3 本地部署和 Java 调用全攻略

谷歌最近发布了 Gemma 3,这是其开源模型家族的最新版本,为 AI 行业带来了深远的创新。Gemma 3 凭借多模态处理能力、庞大的上下文窗口和增强的语言支持,标志着大型语言模型 (LLM) 发展的重要里程碑。该模型的开源特性为开发者和研究人员提供了前所未有的机会,可以在各种应用场景中探索和利用先进的 AI 能力。

文章图片
#java#开发语言#人工智能 +1
【AI大模型】什么是AI幻觉,为什么大语言模型会胡编乱造(及如何解决)

AI “幻觉”指的是大语言模型(LLM)在缺乏真实依据的情况下生成不准确、误导性甚至完全虚构的内容。其幻觉现象源于模型架构的局限性以及基于概率的生成方式的限制。尽管它们目前无法被完全消除,但理解幻觉产生的原因为有效的缓解提供了基础。本篇文章来自 Emil Sorensen(kapa.ai 创始人&CEO)的最新博客,他在文章中重点探讨了 AI 幻觉产生的原因、减少幻觉的技术策略,以及最新的研究进展

文章图片
#人工智能#语言模型#自然语言处理
    共 402 条
  • 1
  • 2
  • 3
  • 41
  • 请选择