logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文彻底搞懂深度学习 - 反向传播(Back Propagation)

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

文章图片
#深度学习#人工智能#学习
【程序员必看】BrowserWing:大模型驱动的浏览器自动化神器,开源免费,小白也能轻松上手!

BrowserWing是一个开源免费的浏览器自动化AI框架,采用预录制行为+大模型调度的创新方案,实现token友好且无需大量算力。该工具支持多种实用场景如舆情分析、自动发文、商品对比等,即使非程序员也能轻松上手。只需下载对应系统二进制文件并安装Chrome浏览器即可运行,通过清晰的任务描述配合强大大模型可实现高效自动化任务。

文章图片
#自动化#运维#oracle +4
【大语言模型】什么是向量化(Embedding)?一篇带你从入门到精通!

Embedding(嵌入)是大语言模型(如 BERT 和 GPT)的核心组件,其作用是将人类语言转换为机器能理解的数值向量。这一过程类似于为每个词、子词或符号赋予一个“数字身份证”,使得模型能够捕捉语义信息,让相似的词(如“快乐”和“高兴”)在向量空间中距离更近。

文章图片
#语言模型#人工智能
【收藏必备】开源AI大模型终极指南:MiniMax登顶,DeepSeek、Qwen各领风骚

本文盘点了全球开源AI大模型最新排名,MiniMax M2以61分登顶,gpt-oss系列性价比惊人,DeepSeek编程能力出色,Qwen3中文优化最佳。分析了2025年四大趋势:国产崛起、性能价格突破、商业化加速和速度优化。根据不同需求提供了选择建议:性能选MiniMax,编程选DeepSeek,中文场景推荐Qwen3。选择需考虑性能、场景、技术和许可因素。

#人工智能#学习
一文彻底搞懂深度学习:Transformer架构

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

文章图片
#深度学习#transformer#人工智能
大语言模型的“涌现”之谜:能力还是智能?

苇草智酷(全称:北京苇草智酷科技文化有限公司)是一家思想者社群组织。通过各种形式的沙龙、对话、培训、丛书编撰、论坛合作、专题咨询、音视频内容生产、国内外学术交流活动,以及每年一度的苇草思想者大会(原名互联网思想者大会),苇草智酷致力于广泛联系和连接科技前沿、应用实践、艺术人文等领域的学术团体和个人,促成更多有意愿、有能力、有造诣的同道成为智酷社区的成员,共同交流思想,启迪智慧,重塑认知。

文章图片
#语言模型#人工智能#自然语言处理 +4
通俗易懂解析深度学习的四大核心(前向传播、损失函数、反向传播、迭代学习)

本文通过"学做菜"的生动比喻,系统解析了深度学习的四大核心环节:前向传播(做菜过程)、损失函数(味觉评判)、反向传播(调整配方)和迭代学习(从菜鸟到大师)。文章详细解释了输入层、隐藏层、输出层的运作机制,以及如何通过链式法则和梯度计算不断优化模型参数,最终实现AI从"菜鸟"到"大师"的蜕变。整个过程与人类学习惊人相似,都是通过实践、反馈和持续改进掌握技能。想象你在学做菜:第一次做可能很难吃,但每次

文章图片
#深度学习#学习#人工智能 +1
微调(Fine-tuning)大语言模型(一)什么是 Fine-tuning?为什么要Fine-tuning?微调基础概念

GPT-3 使用大量互联网上的语料,训练完成后,并不适合对话这个场景。如给到 GPT3 输入“中国的首都是哪里?” GPT3 基于训练后的模型的参数进行推理,结果可能是“美国的首都是哪里?训练数据中,这两句话一起出现的概率非常高,在GPT3的训练预料里面可能也会出现多次。但这种输出明显不满足 ChatGPT 的场景。还需要多阶段的优化过程使 ChatGPT 更擅长处理对话,并且能够更好地理解和回应

文章图片
#人工智能
大模型论文 | 大语言模型的概念知识编辑

尽管DBpedia Ontology树状结构提供了概念和实例的基本框架,但对于每个概念的具体定义和语义描述相对匮乏。为了弥补 DBpedia 在概念定义上的不足,我们引入了另一知名知识库——Wikidata。例如,当 DBpedia 标注“摩天大楼”这一概念时,Wikidata 可以进一步补充其定义:“一种高度超过特定值的高层建筑物”。同时,为了提高数据质量,我们对所有引入的概念和定义描述进行了人

文章图片
#语言模型#人工智能#自然语言处理
大语言模型在推荐场景的实践

可以看出LLM有应用在推荐链路的不同阶段的潜力,小红书是应用在召回阶段,字节是在排序阶段,而且都获得了不错的收益。期待未来LLM能简化重构推荐的链路。

文章图片
#语言模型#人工智能#自然语言处理
    共 1297 条
  • 1
  • 2
  • 3
  • 130
  • 请选择