logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek爆了,普通人如何入局大模型,零基础入门到精通,收藏这一篇就够了

最近一段时间,国产AI大模型DeepSeek异军突起,强势登顶Apple Store免费App排行榜第一名,超越了ChatGPT,火爆全球。,而且还预示着未来可能会有更多资源投入到这一领域中,那么对于想要转行、提升自己竞争力的小伙伴来说,领域可能是一个不错的选择。

文章图片
#自然语言处理#人工智能
DeepSeek-llm-7B-Chat微调教程_deepseek 微调

高性价比:DeepSeek-V2模型以其史无前例的性价比著称,推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。架构创新:DeepSeek对模型架构进行了全方位创新,提出崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,独创的DeepSeekMoESparse结构,也把计算量降

文章图片
#人工智能#自然语言处理#AI
DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建

DeepSeek R1的特点在于使用强化学习(RL)进行后期训练。预训练:利用大规模语料库创建一个 “预测下一个单词” 的模型。监督微调(SFT):使用高质量的、人工创建的指令-响应配对数据,针对特定任务对模型进行微调。基于人类反馈的强化学习(RLHF):由人类评估模型的输出,并将评分作为奖励来更新模型。据说,DeepSeek R1在大规模地进行强化学习,尤其是上述的第三步。

文章图片
#自然语言处理#语言模型#RAG
网络安全工程师的证书有什么用? 必备证书有哪些?_网络工程师有什么用

网络安全工程师相关的证书有很多,比如cisp(注册信息安全专业人员)、cissp(信息系统安全专业认证)含尽量比cisp高、NISP、数通认证等证书,细分的话还是比较多,你可以根据自己专业方向选择对应证书考试,不过有的证书需要满足工作年限才能考取(这个也有方法解决,不详述)。考网络安全工程师的证书有以下好处:1,应聘加分;2,有证书人员,进入企业是可以加分的,也就是薪资方面比没有证书的人多;3,有

文章图片
#网络#web安全#安全 +2
10种常用的数据分析思路!

道家曾强调四个字,叫“道、法、术、器”。在数据分析和产品、运营优化方面,数据分析方法是其核心,属于“法”和“术”的层次。那么如何做好数据分析呢,今天咱们来讲讲十大数据分析的方法。细分分析是数据分析的基础,单一维度下的指标数据信息价值很低。细分方法可以分为两类,一类是逐步分析,比如:来北京市的访客可分为朝阳,海淀等区;另一类是维度交叉,如:来自付费SEM的新访客。细分用于解决所有问题。比如漏斗转化,

文章图片
#数据分析#前端#人工智能
网络安全工程师的证书有什么用? 必备证书有哪些?_网络工程师有什么用

网络安全工程师相关的证书有很多,比如cisp(注册信息安全专业人员)、cissp(信息系统安全专业认证)含尽量比cisp高、NISP、数通认证等证书,细分的话还是比较多,你可以根据自己专业方向选择对应证书考试,不过有的证书需要满足工作年限才能考取(这个也有方法解决,不详述)。考网络安全工程师的证书有以下好处:1,应聘加分;2,有证书人员,进入企业是可以加分的,也就是薪资方面比没有证书的人多;3,有

文章图片
#网络#web安全#安全 +2
学大模型必看这个gitHub项目!!汇集了所有开源中文大模型资源,含各领域微调大模型、数据集及教程

2022年底“大模型”在国内突然遍地开花,不管你身处什么行业,都或多或少听说或使用过大模型相关的工具,也听说过大模型训练是一件超级烧钱的事情。那你是否有想过大模型训练为什么会这么烧钱,或者说大模型到底大在了哪里呢?防止劝退,阅读本文章你不用担心看不懂晦涩难懂的公式以及计算过程,本文仅作为一篇大模型科普文章,带你了解你使用的大模型背后的故事,文章最后会推荐一些帮助博主日常提效的大模型工具,希望通过本

文章图片
#人工智能#开源
java开发程序员转行可以做些什么?

Java程序员是一个职位,避免不了会出现有人想转行或者被迫转行的情况,有同学想要了解一下Java程序员转行的话都能干什么,这里小编就来给大家介绍几个比较多的,以供大家参考。

文章图片
#自然语言处理#java#人工智能
2025年冲击AI领域!6个月掌握LLM的必经之路!

作为一名从电子工程背景转型为专注于大型语言模型(LLMs)和生成式AI的数据科学家,我理解进入AI领域的挑战与兴奋。到2025年,行业格局与我开始旅程时有了显著变化。让我分享一个实用的学习路径,无论您是全新起步还是从其他领域转型。结合我自身的经历和行业经验,我将重点介绍在当今AI领域中最重要的技能和知识。

文章图片
#人工智能#自然语言处理#经验分享 +1
如何微调(Fine-tuning)大语言模型?

本文介绍了微调的基本概念,以及如何对语言模型进行微调。从 GPT3 到 ChatGPT、从GPT4 到 GitHub copilot的过程,微调在其中扮演了重要角色。什么是微调(fine-tuning)?微调能解决什么问题?什么是 LoRA?如何进行微调?本文将解答以上问题,并通过代码实例展示如何使用 LoRA 进行微调。

文章图片
#语言模型#人工智能#自然语言处理
    共 19 条
  • 1
  • 2
  • 请选择