logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI大模型】终于!有人总结了大语言模型(LLM)学习路线,超详细!

这篇指南提供了学习大型语言模型(LLM)的完整路线图。内容分为LLM基础知识和科学家进阶两大部分:基础知识涵盖机器学习数学原理、Python编程、神经网络和NLP核心概念;进阶部分深入讲解Transformer架构、注意力机制、模型预训练和微调技术(LoRA/QLoRA等)。文章推荐了大量优质学习资源,包括视频教程、开源项目和论文解析,适合不同阶段的学习者系统掌握LLM开发与应用技能。

文章图片
#人工智能#语言模型#学习
【DeepSeek大模型】5分钟极速部署DeepSeek!3步零代码打造个人AI助理(附保姆级操作文档)

DeepSeek,如此亲民,逆天了!AI的世界瞬息万变,来晚一步,都翻天覆地!来,跟上快速3步5分钟,打造本地大模型!第一步:下载安装 Ollama网址:https://ollama.com/_Ollama是_一个专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计的开源框架。你可以把Ollama看作是一个装LLM的容器。下载后,直接运行OllamaSetup安装,然后下一步下一步,就可以了

文章图片
#人工智能#语言模型
初识AI Agent——以大模型为核心的智能体

Google Duplex是谷歌在2018年推出的一款AI助手,能够通过电话自主完成复杂任务,如预约餐馆等。随着GPT等大模型的发展,AI技术进入2.0时代,AI Agent(人工智能代理)成为焦点。AI Agent不仅限于生成文案或优化搜索,而是作为通用问题求解器,能够理解、分析并响应人类输入,执行任务和决策。AI Agent分为单Agent、多Agent和混合Agent,分别适用于独立任务、协

文章图片
#人工智能#语言模型#microsoft
【DeepSeek】从LLM到R1:DeepSeek首次公开的“模型进化论“如何改变AI研发范式?

1.1 简介1.2 摘要1.3 结论2.1 简介2.2 摘要2.3 结论3.1 简介3.2 摘要3.3 结论4.1 简介4.2 摘要4.3 结论5.1 简介5.2 摘要5.3 结论5.4 DeepSeek R1 的下载与使用DeepSeek 推理大模型 R1的发布在AI社区引发了冲击波,颠覆了人们对实现尖端AI性能所需条件的假设。DeepSeek 完全跳过监督微调(SFT),选择依赖强化学习(RL

文章图片
#人工智能#语言模型#windows
【AI大模型】今夜,Qwen3发布,这就是目前最强的开源模型

今夜无眠。一直写稿到现在,因为,那个源神杀回来了。今天凌晨5点,阿里发布了全新一代模型**Qwen3**(简称千问3)。有多牛呢?与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶尖模型相比,旗舰模型**Qwen3-235B-A22B**在编码、数学和通用能力等基准测试中,取得了非常亮眼的成绩。

文章图片
#人工智能#语言模型#windows
【AI大模型入门】漫画图解:一口气搞懂大模型的10个核心概念

每个大模型都有Token上限,就像陈塘关的城墙只能用有限数量的砖块建造。常见的大模型一次能处理几千到几万个Token,超过这个数量,前面的内容就会被“遗忘”。

文章图片
#人工智能#语言模型
用好Deepseek,看这一篇就够了

2025年,AI行业似乎被按下了快进键,这一切都开始于中国的首款AI推理模型Deepseek宣布开源。首先,是国内的各种媒介(无论是文字新闻,还是长短视频)展开高热度讨论;其次,是与国内外大模型相较高下的各种测评;然后,是各大平台相继接入Deepseek模型,缓解Deepseek的官网访问压力;最后,是各路资本的热烈追捧。Deepseek之所以爆火,是因为它具有更像人的逻辑思维能力进行深度思考,能

文章图片
#人工智能#语言模型#windows
【DeepSeek入门学习】DeepSeek 超全面指南!入门 DeepSeek 必看

最近,AI界出现了一匹黑马——DeepSeek。这个名字可能对很多人来说还比较陌生,但它已经在全球范围内引发了巨大的关注,甚至让一些科技巨头感到了压力。今天,就让我们一起走进DeepSeek的世界,看看它到底有多厉害!1、DeepSeek是什么?DeepSeek(中文名:深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能模型。它的英文名“DeepSeek”可以读作“深思”(D

文章图片
#人工智能#语言模型
DeepSeek接入个人知识库,回答速度飞快,确实可以封神了!

1DeepSeek知识库软件有些读者第一次看到,可能有些懵,简单介绍下。在过去我们一直在开发DeepSeek+个人知识库软件,支持文件分析完全在本地,不用担心数据泄密;因为是本地自己使用,没有文件上传数量限制,文件大小等诸多限制;利用DeepSeek自身强大推理能力,使用此软件就能逐步搭建一个完全懂自己电脑文件的AI,可以说比较实用。个人知识库接入AI大模型,主流的解决方案就是RAG(Retrie

文章图片
#人工智能#microsoft#语言模型
【大模型学习】2025年6月主流大模型盘点:差异、应用场景和选型指南

大型语言模型(LLM)的竞赛在2025年愈发白热化。无论是封闭的商用模型还是开源阵营,各路“大神”频出:OpenAI推出了升级版的GPT-4系列和全新的“O系列”推理模型,Anthropic的Claude进化到3.7版引入“思考模式”,Google DeepMind的Gemini 2.5问世并主打多模态和超长上下文,中国的Alibaba发布了Qwen 2系列(通义千问2代)、零一万物开源了Yi-3

文章图片
#人工智能#语言模型
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择