logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据开发转行大模型应用开发,我为何坚定入局AI?因为时代抛弃你招呼都不会打!

本文从大数据工程师视角,探讨转向大模型应用开发的技术逻辑与职业价值。技术演进方面,大数据处理逐渐成为基础设施,AI与大数据的融合催生了以大模型为代表的集大成者。技能迁移角度,数据工程经验、分布式系统知识都可自然过渡至大模型开发。市场需求显示,企业对AI解决方案需求激增,大模型应用场景广泛,人才缺口显著。职业发展层面,这一转型可拓展技术广度、提升业务影响力,并创造潜在创业机会。个人驱动因素包括持续学

文章图片
#人工智能#学习
【AI工具】实战:使用Kimi探索版制作985院校思维导图

文章摘要:一位高考生家长咨询985院校选择问题,作者利用AI工具快速整理相关信息。首先使用Kimi探索版智能体进行深度联网搜索,获取最新985院校名单及所在城市,并生成Markdown格式结果;随后通过WPS AI将结构化数据自动转换为清晰可视的思维导图。文中还介绍了大模型学习资源,包含7阶段学习路线、300多集视频教程及行业最新资料,涵盖从系统设计到商业落地的全栈技能。完整AI学习资料可通过CS

文章图片
#人工智能#产品经理#大数据
Qwen3-Coder实战揭秘:从0到1打造商业级API平台,全程开源!

想做个像样的 API 平台,真的挺费劲。用别人的平台?界面丑、功能僵硬。界面好看点的,还不支持二次开发。自己从零搭建?前后端一套下来,没一两个礼拜搞不定,对非技术背景的朋友来说,就更难了。但还是得做。

文章图片
南京大学俞扬教授:通用奖励模型早就在LLM里!

研究发现,大语言模型(LLMs)通过"next-token prediction"训练时,已内生出通用奖励模型,无需额外训练。这一发现首次为强化学习提升语言模型性能提供了数学证明,突破了传统RLHF流程中昂贵奖励模型训练的瓶颈。研究采用逆向强化学习框架,证明模型logits可直接作为Q函数计算内生奖励,实现了从模型自评估中获取强化信号。该方法可扩展至多模态任务,为个性化对齐和模

文章图片
#人工智能#语言模型#产品经理
Transformer自注意力,大脑般工作?

本文深入解析了Transformer中的注意力机制原理。核心要点包括:1)注意力通过计算查询向量(Q)和键向量(K)的点积衡量Token间相似度,经缩放和Softmax归一化形成权重;2)QK^T矩阵乘法构建n×n相似度矩阵,实现Token间的动态关注;3)注意力机制使模型能自主决定处理每个Token时对其他Token的关注程度,有效捕捉长距离依赖关系。文章还顺带提及了大模型学习资源,包括系统学习

文章图片
#transformer#人工智能#深度学习 +1
AI大模型开发全流程解析及项目实战!掌握应用开发学习路线,快速成为大模型专家!大模型学习路线

开发大模型相关应用,其技术核心点虽然在大语言模型上,但一般通过调用 API 或开源模型来实现核心的理解与生成,通过 Prompt Enginnering 来实现大语言模型的控制,因此,虽然大模型是深度学习领域的集大成之作,大模型开发却更多是一个工程问题。

文章图片
#人工智能#架构#深度学习
大模型从零基础到精通,理论与实践结合的最佳路径!大模型学习路线(超全面!超详细!)收藏这一篇就够了!

在深度学习领域,"大模型"通常指的是模型参数数量庞大、拥有深层结构的神经网络。这些模型的规模通常表现为网络中的参数数量,即模型中需要学习的权重和偏置的数量。具体来说,大模型可能包含数百万到数十亿的参数。

文章图片
#学习#人工智能
本地大模型与知识库部署秘籍:DeepSeek + Dify强强联合,打造智能信息中心!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模

文章图片
#人工智能#语言模型#DeepSeek
2025年AI产品经理全攻略!零基础到进阶一站式学习!

AI产品经理的核心能力在于AI思维,而不仅是算法知识。AI产品设计追求前端简单、后端复杂的特性,系统复杂度决定智能化程度。人工智能产业链分为基础层(芯片、算力)、技术层(算法模型)和应用层(场景落地),需要上下游协同发展。基础层以硬件为核心提供算力支持,技术层聚焦算法研发,应用层实现产品落地,三者共同推动AI产业进步。

文章图片
#人工智能#产品经理#AI
刚刚,DeepSeek 又发新模型DeepSeek-OCR,小而美玩出新高度!

就在刚刚,DeepSeek 开源了一个 3B 模型 DeepSeek-OCR。虽然体量不大,但模型思路创新的力度着实不小。众所周知,当前所有 LLM 处理长文本时都面临一个绕不开的困境:计算复杂度是平方级增长的。序列越长,算力烧得越狠。

文章图片
#数据库#自然语言处理#语言模型 +2
    共 2416 条
  • 1
  • 2
  • 3
  • 242
  • 请选择