logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek全新玩法合集,80%的人还不知道(建议收藏)

新版 DeepSeek V3 的一手实测大家都看了没?(猛戳回顾👉)[刚刚,DeepSeek悄悄更新,一手实测来了]毫无疑问,DeepSeek V3 这波更新,可绝对是个里程碑。全球 AI 格局注定要被颠覆,谁也阻挡不了,毕竟这是国运级 AI。那种久违的又激动、又紧张的感觉,回来了!今天官方在公众号发布了文章。不出所料,跑分和昨天实测一样,数学和代码的跑分超越了 GPT-4.5 和 Claude

文章图片
#人工智能#语言模型#自然语言处理
【大模型学习】AI 大模型应用开发全攻略

AI 大模型应用开发作为新兴领域,不断出现新的技术:**LLM、Prompt、RAG、Agent、Fine-tuning、MCP** 等,本文聚焦 AI 大模型应用开发,带领大家入门,带领大家了解 AI 大模型应用开发的全攻略。

文章图片
#人工智能#语言模型
复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来

复旦大学自然语言处理团队(FudanNLP)近期发布了一篇长达86页的综述论文,全面梳理了基于大型语言模型(LLM)的智能代理(Agent)现状。论文从AI Agent的历史出发,详细探讨了LLM-based Agent的背景、构成、应用场景以及代理社会等关键问题。作者们提出了一个由控制端(Brain)、感知端(Perception)和行动端(Action)组成的智能代理框架,并深入分析了每个部分

文章图片
#人工智能#语言模型#AI
【大模型学习】2025最新AI大模型应用开发小白入门必看!

摘要 本文旨在帮助非AI背景的开发者理解大模型应用开发的核心要点。文章指出,参与大模型开发无需深厚的数学基础,关键在于掌握应用开发流程和核心能力。主要内容包括: 大模型应用架构与传统应用类似,LLM只是一个下游服务 常见应用场景:文生文、文生图、图生图、文生视频等 与大模型协作的关键:Prompt Engineering,包括Zero-shot和Few-shot方法 程序员机会:AI Agent开

文章图片
#人工智能#语言模型
【Ai大模型】漫画图解:一口气搞懂大模型的10个核心概念

当哪吒在闹海宫犯下错误后,太乙真人不仅惩罚他,还教导他正确的力量运用方法。类似地,RLHF不只是惩罚模型的不良输出,还通过强化学习算法引导模型产生更符合人类期望的回应。

文章图片
#人工智能#语言模型#自然语言处理
【大模型学习】从零开始!揭秘大语言模型的训练全过程

本文详细介绍了从零开始训练大语言模型的全过程,包括预训练、监督微调、奖励模型和强化学习四个主要阶段。预训练阶段通过自监督或无监督学习,利用大规模无标签文本数据,使模型掌握语言的基本规律和结构。监督微调阶段则通过特定任务的标注数据,进一步优化模型在具体任务上的表现。奖励模型和强化学习阶段则通过反馈机制,进一步提升模型的生成质量和适应性。文章还详细阐述了每个阶段的数据准备、训练目标和具体流程,为读者提

文章图片
#语言模型#人工智能#自然语言处理 +1
【大模型入门学习】什么是大模型?一文读懂大模型的基本概念(非常详细)零基础入门到精通,收藏这一篇就够了

*大模型是指具有大规模参数和复杂计算结构的机器学习模型。**这些模型通常由[深度神经网络]构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括[自然语言处理]、计算机视觉、语音识别和[推荐系统]等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的[泛化能力],可以对未见过的数据做出准确

文章图片
#人工智能#语言模型#数据挖掘 +1
【大模型学习 】一文读懂大规模AI模型:原理、应用与实战

本文探讨了大规模AI模型的核心特点与应用实践。大模型是指基于深度神经网络、拥有数十亿甚至上百亿参数的学习系统,具有海量参数、高计算需求和多模态支持等特性,在NLP、计算机视觉和推荐系统等领域表现卓越。文章通过BART模型文本摘要、ResNet18图像分类和MLP推荐系统等代码示例,展示了具体应用场景。同时指出大模型面临的训练挑战,包括资源消耗大、数据处理复杂等问题,并提供了基于PyTorch分布式

文章图片
#人工智能#语言模型
【大模型部署】AI大模型本地部署入门教程

想玩转AI大模型?这篇本地部署入门教程不容错过!从LM Studio安装到模型选择与量化,手把手教你打造专属AI环境,兼顾数据隐私与离线运行优势,为你的AI探索之旅奠定基础。

文章图片
#人工智能#语言模型
漫谈DeepSeek及其背后的核心技术!

一、关于DeepSeek公司及其大模型*1.1 公司概况*DeepSeek 2023年7月成立于杭州,是幻方量化旗下的子公司,全称是杭州深度求索人工智能基础技术研究有限公司。“成立时间才一年多”、“最近推出的V3已经能和OpenAI的4o媲美”、“训练成本不到600W美元”、“API定价仅是国内其他头部厂商几十分之一”、“APP已经在中美APP store登上免费应用榜首”;

文章图片
#人工智能#语言模型
    共 76 条
  • 1
  • 2
  • 3
  • 8
  • 请选择