个人主页

@mdaidmx

2025-11-04 19:01:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大模型面试: 怎么做RAG的query改写？

RAG系统中的query改写策略在RAG系统中，高质量知识库常因query语义不对齐导致生成结果偏差。核心解决方法是query改写，通过标准化语义表达提升检索效果。主要策略包括：1）提取核心实体并加权；2）基于5W1H框架补全真实意图；3）消除歧义并拆解逻辑。实现路径从基础工具到LLM智能改写，并以召回率为验证标准。面试需准备落地细节和评估方法，重点关注改写对检索质量的提升作用。

#面试 #职场和发展 #人工智能 +2

AI产品经理面试:AIGC未来的商业模式都有哪些？

《AIGC商业模式的层级演进与变现路径》摘要：本文系统分析了AIGC的四大商业层级：1）基础模型与算力层的API变现；2）平台中间层的生态构建；3）垂直行业应用的降本增效；4）C端的内容消费变现。指出当前商业化主战场在企业服务领域，未来将向"价值链重构"演化，AIAgent平台和生态型模式最具潜力。短期看技术变现，中期重交互革新，长期将形成AI驱动的全新产业形态。文末预告将深度

#人工智能 #产品经理 #面试 +1

面试官:请尝试拆解sora2的视频生成过程，并解释生成效果为什么这么好？

Sora2视频生成效果惊艳主要源于三项核心技术：1）语义解析阶段通过构建"时空语义图"精准理解文本内容；2）采用DiffusionTransformer架构实现时空一致的视频生成；3）通过海量视频训练隐式学习物理规律。这三项创新使生成的视频不仅画面连贯，还具备真实的物理特性，实现从"制作视频"到"模拟世界"的技术跨越。

#人工智能 #AIGC

面试官：如何避免 Chunk 粒度太细导致“语义碎片化” ？

摘要：语义碎片化指Chunk拆分过细导致逻辑断裂、加载变慢或上下文丢失的问题。解决方案包括：1️⃣ 锚定最小语义单元，确保每个Chunk能独立表达完整功能或逻辑（如工程化中合并强耦合模块，内容生产按闭环拆分）；2️⃣ 建立语义关联，通过预加载、提示词等方式保持拆后关联性；3️⃣ 动态合并策略，根据使用频率或共现率优化Chunk粒度（高频合并，低频拆分）。核心原则是Chunk需能独立表达完整语义，

#面试 #人工智能 #AI

一文搞懂大模型SFT：数据构建、质量评估与工业化流程

SFT（监督微调）是大模型实现人类意图对齐的关键阶段，其数据质量直接决定模型性能。优质SFT数据需多源构建：过滤公开数据、扩展专家种子数据、回流用户反馈。数据标准强调结构化指令、多样性、对抗样本和安全过滤。工业级流水线采用自动化清洗质检结合人工抽检，实现高效迭代。

#人工智能 #机器学习 #深度学习

面试官：如何判断一个Embedding的质量？

Embedding是语义搜索、推荐、RAG 等系统的底层“地基”。判断 Embedding 是否合格，不能只看单一指标（比如相似度或维度），要从语义一致性、泛化能力、计算/部署成本三维度做系统评估。本文给出工程可执行的方法、指标、常见坑与实践检查清单，便于在项目中落地评测与改进。

#架构 #面试 #人工智能 +1

一文讲清：AI、AGI、AIGC、NLP、LLM、ChatGPT的区别与联系

本文系统梳理了AI领域核心概念及其层级关系：AI是总概念，包含追求通用智能的AGI和内容生成的AIGC等技术方向。重点解析了NLP（AI语言分支）、LLM（NLP突破性进展）及ChatGPT（LLM应用代表）的关联，并用层级图展示"AI→技术分支→具体应用"的逻辑链条。针对开发者，建议重点掌握LLM调用、AIGC产品设计和Prompt工程三大核心技能，为AI应用开发奠定基础。

#人工智能 #AIGC #自然语言处理 +1

面试官：未来Agent的演化方向是什么？

AI智能体演进正经历从工具调用到生态协作的四个阶段：1）ToolAgent阶段，通过API调用执行任务；2）AutoAgent阶段，具备自主任务规划和决策能力；3）CrewAgent阶段，实现多智能体分工协作；4）AgenticOS阶段，形成自组织的数字生态系统。技术发展从单一功能转向智能体间的协同进化，未来AI竞争将聚焦于智能体系统的协作效率而非模型规模，最终形成"虚拟企业"

#人工智能

一文讲清：AI、AGI、AIGC、NLP、LLM、ChatGPT的区别与联系

#人工智能 #AIGC #自然语言处理 +1

一文讲清：AI、AGI、AIGC、NLP、LLM、ChatGPT的区别与联系

#人工智能 #AIGC #自然语言处理 +1

到底了