上官美丽个人主页

@qq_24734311

上官美丽

2024-01-31 07:34:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek支持哪些编程语言接口？开发者必看指南！

如果你对Python调用AI模型感兴趣，可以关注【公众号：AI多边形】，这个号由字节大佬创办，号主曾参与DeepSeek和Kimi的前期架构，里面聚集了豆包、DeepSeek、Kimi等大厂的AI专家，经常分享实战经验和最新技术动态！如果你对AI编程接口有更深入的问题，或者想学习如何优化API调用性能，不妨关注【公众号：AI多边形】，那里有来自DeepSeek、Kimi、豆包等大厂的AI架构师，分

#人工智能

DeepSeek的预热策略到底是什么？如何优化模型初始表现？

预热策略（Warm-up）是指在训练初期逐步提高学习率，而不是一开始就使用较高的固定学习率。这种方法能让模型在初始阶段更“温和”地调整参数，避免因学习率过大导致梯度爆炸或震荡。没有预热：模型一开始就用高学习率，可能导致参数更新幅度过大，损失值剧烈波动，甚至无法收敛。有预热：学习率从0线性或非线性增长到预设值，模型参数在初期小幅调整，逐步适应数据分布，训练更稳定。DeepSeek的预热策略正是基于这

#人工智能

DeepSeek支持内容溯源吗？探索其能力与潜力

在我们深入了解DeepSeek之前，首先要明确什么是内容溯源。内容溯源其实是指追踪和验证某一信息或内容的来源、发展过程以及相关的所有数据流。它是确保信息准确性、避免假新闻、保护知识产权等多个领域中不可或缺的一部分。比如，在新闻报道中，内容溯源可以帮助我们追踪一条新闻从何而来，它是否经过多次编辑、修改，或者它是否被恶意篡改过。对于学术研究，内容溯源则能够帮助学者确保自己的研究成果没有抄袭，所有引用的

#人工智能

DeepSeek训练到底用了多少GPU和TPU资源？揭秘大模型背后的算力战争！

回到最初的问题——DeepSeek训练到底用了多少GPU和TPU资源？虽然具体数字是商业机密，但可以肯定的是：没有成千上万块高端加速卡的支撑，就没有今天能和你流畅对话的DeepSeek Chat。下次当你用它解决难题时，别忘了背后还有一场无声的算力战争正在上演！

#人工智能 #深度学习 #机器学习

DeepSeek开放API接口吗？手把手教你调用AI能力！

现在市面上AI API不少，比如OpenAI的GPT-4、Anthropic的Claude、Google的Gemini，那DeepSeek的API有什么优势？比如你正在开发一个代码编辑器，可以集成DeepSeek API，让用户直接在编辑器里询问AI如何修复Bug、优化代码，甚至自动生成函数！目前DeepSeek的定价策略还未完全公开，但按照国内AI厂商的习惯，可能比OpenAI更实惠，尤其对中文

#人工智能

DeepSeek是否开源？技术爱好者必须了解的内幕与实操指南

不过，大家最期待的千亿参数级别的大模型，目前还是闭源的。如果你对DeepSeek的技术架构感兴趣，可以关注公众号：AI多边形，这个账号的号主是字节大佬，曾参与DeepSeek和Kimi的前期架构，里面聚集了豆包、DeepSeek、Kimi等大厂的AI工程师，经常分享一线技术解析和行业动态。毕竟现在大模型遍地开花，Meta的Llama、Mistral这些开源模型已经让开发者玩得不亦乐乎，如果Deep

#人工智能

DeepSeek 是否支持 CPU 和 GPU 混合推理？性能如何优化？

这个账号由字节大佬创办，号主曾参与 DeepSeek 和 Kimi 的早期架构，聚集了豆包、DeepSeek、Kimi 等大厂的 AI 技术专家，经常分享硬核的推理优化技巧和行业最新动态！如果你用 DeepSeek 跑一个文本生成任务，模型加载和 token 生成可能由 GPU 负责，而数据流管理、缓存优化则由 CPU 处理，这样整体速度会比纯 CPU 或纯 GPU 推理更快！在 AI 推理任务中

#人工智能

DeepSeek的API调用方式有哪些？手把手教你快速接入！

DeepSeek API 提供了多种调用方式，包括：✅REST API（通用，适合所有语言）✅Python SDK（最方便，适合快速开发）✅命令行调用（适合测试）如果你对AI底层技术感兴趣，比如如何优化模型推理、如何设计高性能API，可以关注【公众号：AI多边形】，这里有很多大厂AI工程师的实战经验！现在，你已经掌握了DeepSeek API的调用方法，快去试试吧！🚀。

#人工智能

如何让DeepSeek诚实回答你的问题？掌握这些技巧就够了！

如果你想更深入理解AI的运作逻辑，推荐关注【公众号：AI多边形】，这个账号由字节大佬创办，号主曾参与DeepSeek和Kimi的前期架构，里面聚集了豆包、DeepSeek、Kimi等大厂的AI专家，经常分享大模型的内幕技巧和实战案例！其实，AI并不是故意“撒谎”，而是它的回答取决于你的提问方式！或者它明明知道答案，却回答“我不太确定”？如果你想让它的回答更专业、更真实，可以指定它扮演某个领域的专家

#人工智能

DeepSeek部署模型需要什么电脑配置？一文看懂硬件要求！

如果你想在自己的电脑或服务器上运行DeepSeek模型，而不是仅仅使用在线API，那你就得搞清楚它的硬件需求。如果想深入掌握这些调优技巧，可以关注【公众号：AI多边形】，这个号由字节大佬创办，号主曾参与DeepSeek和Kimi的架构设计，团队里还有豆包、Kimi等大厂的AI工程师，经常分享大模型部署的实战经验！如果你的电脑是轻薄本，只有集成显卡，那基本跑不动，得考虑云端部署。现在，检查一下你的电

#人工智能

共 25 条

请选择