logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek 本地部署与API调用全流程指南

通过以上流程,可在10分钟内完成本地部署并实现API调用,满足私有化场景的智能化需求‌12。库,支持文本补全、对话生成等任务‌23。

文章图片
【本地部署教程】手把手教你搭建DeepSeek智能模型本地开发环境

随着AI应用的普及,越来越多的开发者需要在本地环境部署智能模型。本文将详细介绍如何在本地机器上部署DeepSeek模型,并提供完整的配置指南和优化建议。通过本文的指导,您已经成功在本地部署了DeepSeek模型。建议定期关注官方GitHub仓库获取最新更新,也欢迎在评论区分享您的部署经验!DeepSeek官方部署文档GitHub示例项目。

文章图片
#人工智能#数据挖掘#深度学习 +1
大模型在网络安全领域的七大应用

大模型在网络安全领域的应用已从理论探索迈向初步落地,尤其在威胁检测、漏洞挖掘等场景成效显著。未来,随着多模态大模型与边缘计算的发展,网络安全防护将向“预测-防御-自治”闭环演进,进一步缩小攻防信息差。:恶意代码呈现模块化、跨平台传播特征,需结合大模型动态更新检测规则。:安全编排自动化(SOAR)成为主流,但需持续优化剧本覆盖场景。:动态策略管理成熟度达L2级,已集成到防火墙、IPS等设备。:攻击溯

#web安全#自动化#安全 +1
数据整理利器:一篇文章教你玩转DeepSeek数据分析!

数据分析不再是难题!跟DeepSeek一起,让数据说话,让分析更轻松!

文章图片
#数据分析#大数据#数据挖掘
LoRA(Low-Rank Adaptation)微调 超全参数详解+标准化完整步骤指南

本文详细介绍了大模型微调中的LoRA(低秩适配)方法,强调其参数高效、显存占用低、训练速度快等核心优势。重点解析了LoRA的关键超参数(如低秩维度r、缩放系数alpha、目标适配层等)及其调参技巧,并提供了标准化微调流程,包括环境搭建、模型加载、训练配置等实操步骤。适用于LLaMA2、Qwen等主流大模型,帮助用户高效完成模型适配,单卡即可实现7B/13B模型的微调。完整教程可通过指定链接获取持续

#机器学习#深度学习
01大模型微调概述

本文系统介绍了大模型微调技术及其应用。首先阐述了通用大模型的概念与分类,包括语言、视觉和多模态模型。重点分析了微调的必要性:适应专业领域、提高数据安全性、降低计算成本等。详细比较了微调与RAG等技术的特点,并通过医疗、法律等行业案例说明微调的实际价值。文章深入讲解了全量微调、参数高效微调(PEFT)等多种方法,包括LoRA、Adapter等具体技术。最后介绍了DeepSpeed、LLaMAFact

文章图片
deepseek系列教程(清华北大版)

北京大学和清华大学分别推出DeepSeek系列教程文档,涵盖技术原理、部署方案、应用场景及安全防护等内容。北京大学教程重点介绍DeepSeek模型的MoE架构、GRPO算法等技术优势,以及私有化部署方案;清华大学教程则聚焦大模型安全框架、AI幻觉应对及家庭教育应用。两套教程均提供夸克网盘下载地址,包含5份核心文档,从不同维度解析这一国产开源强推理模型的特点与使用方法,适用于开发者、企业用户及普通学

文章图片
DEEPSEEK灵犀office太高效了,嵌入、满血、几万行数据分析不卡、太赞了!用起来!

这个工具中,无论是对话分析数据,还是查找一些VBA代码,或者函数公式,速度和准确性都非常感人,例如下图就是一份2M找有的文件,3W多行的基本对话产生的数据分析.问题是:如果加班不满半个小时不算加班,如果加班时间超过半个小时,不到一个小时算半个小时,如果加班1个小时不到1个半小时,算1个小时,这个怎么做?如果加班不满半个小时不算加班,如果加班时间超过半个小时,不到一个小时算半个小时,如果加班1个小时

文章图片
#数据分析#java#数据挖掘
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择