logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型应用的模型架构和核心技术原理-以DeepSeek对话助手为例分析

本文深度解析DeepSeek对话助手技术内核:基于Transformer架构,通过自注意力机制实现精准语义理解,多头注意力并行捕捉语法、指代等多维关系;推理阶段采用Top-p采样与KV Cache优化,在创造力与速度间取得平衡。从智能文档生成到代码调试,从企业私有化部署到消费级硬件适配,DeepSeek以MoE架构将成本压至极限。无论是想掌握大模型底层原理的技术人员,还是寻求AI提效的职场人,这篇

文章图片
#人工智能
AgenticWorkflow大模型提效方案设计

Agentic Workflow大模型实践方案

文章图片
#人工智能
AgenticWorkflow大模型提效方案设计

Agentic Workflow大模型实践方案

文章图片
#人工智能
前端对浏览器的理解

本文包含浏览器的大部分知识,涉及面广泛。涵盖浏览器构成、内核、渲染原理、缓存、安全问题、进程线程、事件模型、事件循环、版本检测等模块以及其具体细节。

#前端
antv G6在vue项目中的实践总结

antvG6树图 自定义节点、边;数据更新后重新渲染以及tooltip的使用

文章图片
#vue.js#javascript#前端
到底了