logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-V3 的核心架构: DeepSeekMoE

实践效果:在671B总参数量下实现单 token 仅激活3.7%参数,推理速度提升2.1倍,训练成本降低67%。以上纯个人总结及观点, 如有错误, 还请大佬们指教。

文章图片
#人工智能#算法
Windows部署Ollama可视化(Open WebUI + Docker + Ollama)

登录Ollama官网()点击Download进行下载。

文章图片
#docker#人工智能
智能体(Agent)与工作流(Workflow)

工作流(Workflow)是一种描述业务过程的方法,它将工作流程中的各个步骤和规则抽象化,并通过计算机技术来实现这些流程的自动化。优点缺点Agent动态规划灵活缺乏稳定性Workflow静态规划稳定性高缺乏灵活性完成复杂的任务缺乏稳定性。

文章图片
#人工智能
智能体(Agent)与工作流(Workflow)

工作流(Workflow)是一种描述业务过程的方法,它将工作流程中的各个步骤和规则抽象化,并通过计算机技术来实现这些流程的自动化。优点缺点Agent动态规划灵活缺乏稳定性Workflow静态规划稳定性高缺乏灵活性完成复杂的任务缺乏稳定性。

文章图片
#人工智能
智能体(Agent)与工作流(Workflow)

工作流(Workflow)是一种描述业务过程的方法,它将工作流程中的各个步骤和规则抽象化,并通过计算机技术来实现这些流程的自动化。优点缺点Agent动态规划灵活缺乏稳定性Workflow静态规划稳定性高缺乏灵活性完成复杂的任务缺乏稳定性。

文章图片
#人工智能
DeepSeek-V3 的核心架构: DeepSeekMoE

实践效果:在671B总参数量下实现单 token 仅激活3.7%参数,推理速度提升2.1倍,训练成本降低67%。以上纯个人总结及观点, 如有错误, 还请大佬们指教。

文章图片
#人工智能#算法
到底了