see you again836 个人主页

@2302_79932616

see you again836

2024-12-29 11:22:27 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型面试每日一题】Day 24：假设训练资源有限，如何在模型参数量、训练数据量和训练时长三者间做权衡？

假设训练资源有限，如何在模型参数量、训练数据量和训练时长三者间做权衡？

#面试 #人工智能 #深度学习 +3

【大模型面试每日一题】Day 27：自注意力机制中Q/K/V矩阵的作用与缩放因子原理

自注意力机制中Q/K/V矩阵的作用与缩放因子原理

#面试 #职场和发展 #架构 +3

【大模型面试每日一题】Day 21：对比Chain-of-Thought（CoT）与Self-Consistency在复杂推理任务中的优劣

CoT通过单一路径生成推理链，具有低计算成本和强可解释性，但容易因单步错误导致最终错误。Self-Consistency则通过多路径生成和集成，提升了准确性，尤其在复杂任务中表现更优，但计算成本较高。CoT适用于简单任务和实时交互场景，而Self-Consistency更适合高价值决策任务。两者在推理机制、计算成本和适用场景上各有优劣，选择时需根据具体需求权衡效率与精度。