logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【强烈收藏】从数学底层拆解 Transformer:系统学习路径与核心要点

【强烈收藏】从数学底层拆解 Transformer:系统学习路径与核心要点

文章图片
#transformer#学习#深度学习 +3
【必读】大模型小白必学:一文彻底搞懂Token概念、计算与限制

本文详细解释了大模型中Token的概念,它是大模型能理解的最小语言单位,如同语言积木。文章阐述了Token如何将文字转化为数字向量供模型处理,再转回文字,以及Token数量的计算方法和限制。中文1Token约1-2字,英文约0.75单词。了解Token原理对使用大模型和API开发至关重要,能帮助优化输入、避免超限,并控制成本。

文章图片
#python#人工智能#开发语言 +4
18种RAG技术大比拼:谁才是检索增强生成的最佳选择?

在当今信息爆炸的时代,如何从海量数据中快速准确地获取所需信息,是人工智能领域的一大挑战。Retrieval-Augmented Generation(RAG,检索增强生成)技术应运而生,它结合了检索和生成的优势,通过从大量文档中检索相关信息,再利用这些信息生成高质量的回答。然而,RAG 的实现方式多种多样,不同的技术路径有着不同的优势和局限。今天,我们就来深入探讨一下这些 RAG 技术,看看谁才是

文章图片
#java#android#前端 +3
【小白友好】Agent、知识库、MCP 是什么?3 分钟搞懂大模型入门核心概念

【小白友好】Agent、知识库、MCP 是什么?3 分钟搞懂大模型入门核心概念

文章图片
#面试#人工智能#职场和发展 +3
一文读懂MCP:定义、与API的差异、企业价值、落地路径及未来趋势

一文读懂MCP:定义、与API的差异、企业价值、落地路径及未来趋势

文章图片
#人工智能#transformer#产品经理 +1
DeepSeek技术全景解析(一):一场效率革命的技术解密

DeepSeek的崛起不仅代表了国产AI技术的一次重大突破,也为全球AI领域注入了新的活力。通过一系列算法创新,DeepSeek打破了传统计算架构的限制,在效率和性能上达到了新的高度。其在MoE架构、注意力机制、推理能力等方面的创新,解决了算力瓶颈问题,并通过开源生态的力量推动了技术的普惠和发展。DeepSeek不仅展示了中国团队在AI领域的创新能力,还为全球AI产业格局的重塑提供了新的视角。从短

文章图片
#人工智能#大数据#机器学习 +2
金融AI Agent实战:从0到1构建浦小鹿智能助手,程序员必学的大模型应用架构

通过"五步法"实现从需求明确到迭代优化的全流程落地,覆盖知识问答、流程自动化、数据分析等场景,显著提升工作效率。文章强调金融AI Agent应"辅助不决策、安全是底线"的原则,为行业提供了可复用的AI应用架构参考。

文章图片
#人工智能#金融#架构 +3
一文吃透 LlamaIndex 与 LangChain 的核心区别,看完这篇就够了!

一文吃透 LlamaIndex 与 LangChain 的核心区别,看完这篇就够了!

文章图片
#分布式#transformer#人工智能 +2
一文搞懂SFT、RLHF、DPO、IFT

• SFT、RLHF 和 DPO 都是先估计 LLMs 本身的偏好,再与人类的偏好进行对齐;• SFT 只通过 LLMs 生成的下一个单词进行估计,而 RLHF 和 DPO 通过 LLMs 生成的完整句子进行估计,显然后者的估计会更准确;• 虽然 RLHF 和 DPO 取得比 SFT 好的结果,但代价是高昂的数据构造和计算资源开销;

文章图片
#人工智能#大数据#产品经理 +2
搭建属于你的AI大脑:DeepSeek+RAGFlow保姆级教程

在AI的浪潮中,RAG(检索增强生成)技术正在掀起新的革命。它像一个聪明的图书管理员,能够从海量文档中精准提取信息,并生成自然流畅的回答。RAGFlow作为一款开源的RAG引擎,将复杂的AI技术封装成简单易用的工具,让每个人都能轻松搭建自己的AI知识库。它支持多种文档格式,能够从非结构化数据中提取知识,并提供清晰的引用来源,极大降低了生成内容的幻觉风险。无论你是企业客服、研究人员,还是普通用户,R

文章图片
#人工智能#语言模型#学习 +1
    共 1120 条
  • 1
  • 2
  • 3
  • 112
  • 请选择