
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
与互联网传统的产品经理不同,AI产品经理的能力要求、门槛等相对会更高。本文作者梳理了AI产品经理的工作流程与现有产品经理的区别,可以帮助大家更好理解这个岗位。以下是自己在学习AI产品经理过程中的简单总结,欢迎交流。

2025年春节前,DeepSeek R1推理大模型发布后的表现太炸裂了。地球对面上蹿下跳的,搞的我手机上也一直被霸屏。都这么热了,不得搞起来免得落伍了。这次边看边用边学将Dify LLM应用开发平台结合DeepSeek大模型实践起来,搭建属于自己的AI平台智能体和工作流。顺带留文记录。借用DeepSeek-R1模型自己的回答,DeepSeek-R1 是由中国人工智能公司深度求索(DeepSeek)

过去一年,多模态大型语言模型(MLLMs)在视觉问答、视觉理解和推理等任务上表现出了显著的性能。然而,庞大的模型大小和高昂的训练和推理成本阻碍了MLLMs在学术界和工业界的广泛应用。因此,研究高效和轻量级的MLLMs具有巨大的潜力,尤其是在边缘计算场景中。在本调查中对高效MLLMs的现状进行了全面而系统的回顾。具体而言,作者。

Transformer 与 RNN 不同,可以比较好地并行训练。Transformer 本身是不能利用单词的顺序信息的,因此需要在输入中添加位置 Embedding,否则 Transformer 就是一个词袋模型了。Transformer 的重点是 Self-Attention 结构,其中用到的Q, K, V矩阵通过输出进行线性变换得到。

作为人工智能中最先进的技术之一,检索增强生成(RAG)技术可以提供可靠且最新的外部知识,为众多任务提供了巨大便利。特别是在人工智能生成内容(AIGC)时代,RAG中检索的强大能力在提供额外知识方面使得检索增强生成能够辅助现有生成型人工智能产生高质量输出。最近,大型语言模型(LLMs)展示了在语言理解和生成方面的革命性能力,但仍面临固有限制,如幻觉和过时的内部知识。

随着大型语言模型(LLMs)的出现,人工智能搜索引擎(如SearchGPT)展示了人类与互联网交互的新范式。然而,当前大多数AI搜索引擎仅限于文本设置,忽视了用户查询的多模态性质和网站信息的文本-图像交错特性。 虽然大型多模态模型(LMMs)最近取得了令人印象深刻的进展,但它们是否能作为AI搜索引擎发挥作用仍未得到充分探索。

高性价比:DeepSeek-V2模型以其史无前例的性价比著称,推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。架构创新:DeepSeek对模型架构进行了全方位创新,提出崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,独创的DeepSeekMoESparse结构,也把计算量降

由于是讲“图文多模态”,还是要从“图”和“文”的表征方法讲起,然后讲清楚图文表征的融合方法。对于文本模态的表征发展,我们在《闲话NLP:文本表征的半世今生》(https://zhuanlan.zhihu.com/p/473195206)一文中有过一轮的梳理,因此本文只要讲两件事情:视觉表征:分为两个部分问题,一是如何合理建模视觉输入特征,二是如何通过预训练手段进行充分学习表征,这两点是基于视觉完成

本文介绍了如何在本地部署和使用Ollama大模型服务。主要内容包括:1) Ollama在不同系统(Mac、Windows、Linux)的安装方法,其中Linux提供裸机和Docker两种部署方式;2) 服务配置说明,如修改模型存储路径、指定GPU设备等;3) 基本使用指南,包括常用命令解释和官方模型库介绍。Ollama作为便捷的大模型本地部署工具,配合Open WebUI可实现人人拥有大模型自由的

本文介绍了三种主流的智能客服设计方案:1)基于开源LLM模型微调;2)检索增强生成(RAG)方法;3)结合前两者的多工作流Agent方案。重点分享了智能客服Agent技术的实践经验,通过引入深度学习、多轮对话跟踪等技术,将意图识别准确率提升至92%,用户满意度显著提高。文章涵盖从需求分析到生产部署的完整技术链路,包括多轮对话维护、知识库集成等核心环节。该方案已在多家企业成功落地,日均处理10万+对








