logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Transformer位置嵌入详解:从基础到RoPE解决词序感知难题

本文介绍Transformer模型中解决词序感知问题的三种位置嵌入方法:函数编码(sin/cos)、可学习位置嵌入和旋转位置编码(RoPE)。RoPE通过旋转词向量捕捉相对位置关系,配合PI和YaRN扩展方法可处理长文本输入。这些技术使模型能够理解语言中的顺序信息,解决了Transformer无法感知词序的关键缺陷。

文章图片
#transformer#深度学习#人工智能
大模型落地应用观察:难点与破局

大模型太多、应用却太少,大模型要跑起来、更要用起来……怎样走好大模型落地应用“最后一公里”,成为近期业内外探讨的焦点。“百模大战”打响,并非言过其实。目前,通过国家网信办备案的大模型已达190多个,注册用户超6亿。今年来,各家大模型全面降价,甚至一降到底免费调用。“不要去卷模型了,卷应用吧”,某知名企业多次表达这一观点,映射出大模型赛道竞争已进入卷生态、拼“获客”新阶段。从百花齐放到场景落地,大模

文章图片
#人工智能#语言模型#机器学习 +2
基于大模型的知识助手:7家头部企业“大模型+知识管理”落地实践

知识,作为企业最宝贵的资产之一,其有效管理和应用成为企业提升竞争力的关键。然而,传统的知识管理系统往往存在信息孤岛、检索效率低下、知识更新滞后等问题,难以满足企业快速响应市场变化的需求。基于大模型的知识助手应运而生,它以其强大的语义理解和数据处理能力,正在成为企业知识管理的最佳解决路径,有效打通了企业知识应用的“最后一公里”,为企业知识管理带来了革命性的变革。基于大模型的知识助手不仅能够自动整合企

文章图片
#人工智能#数据分析#搜索引擎 +1
从零开始构建企业智能问答系统:Ollama+Deepseek+MaxKB本地部署指南

本文介绍了使用Ollama+Deepseek+MaxKB搭建企业级本地知识库的完整流程。内容包括Docker安装MaxKB,配置Ollama模型,创建知识库上传文档,以及构建智能问答应用。方案强调数据安全和检索效率,适合企业知识管理需求。最后还展示了如何将系统嵌入第三方应用,实现更广泛的应用场景。

文章图片
#人工智能
从一位AI大厨的角度带你全方位了解大模型微调

本文介绍了微调的基本概念,以及如何对语言模型进行微调。微调技术作为迁移学习的重要实现方式,其核心在于通过特定领域数据的二次训练,使预训练语言模型获得领域适配能力。随着分布式训练技术和模型压缩技术的进步,微调过程的计算效率持续提升。相信随着算力增长,微调的成本门槛会越来越低,微调技术应用的场景也会越来越多。未来,随着量子计算等新型计算架构的发展,微调技术有望实现分钟级的模型迭代周期,这将彻底改变现有

文章图片
#人工智能#深度学习#机器学习
Llama 3.1本地部署终极指南:基于Ollama的完整解决方案

2024 年 7 月 24 日,Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,Llama 3.1 405B 支持上下文长度为 128K Tokens, 增加了对八种语言的支持,号称第一个在常识、可操纵性、数学、工具使用和多语言翻译方面与顶级人工智能模型相媲美的模型。前排提示,文末有大模型AGI-CSDN独家资料包哦!当然 405B 新一代大模型所需要的算力成本也是巨大

文章图片
#搜索引擎#人工智能#机器学习 +2
AI大模型工业应用模式及其实现

人工智能是引领这一轮科技革命和产业变革的战略性技术,具有“头雁”效应,溢出带动性很强。通用人工智能大模型(以下简称“大模型”)作为人工智能从专用化迈向通用化的发展新阶段,是集智能感知、智能分析、智能决策、智能执行等功能于一体的泛在智能技术,通过数据、算力、算法三要素深度融合,实现生产要素优化配置。从生产结构来看,人工智能技术已成为现代工业生产的核心组成部分,能够大幅提高生产效率、优化资源配置、降低

文章图片
#人工智能#语言模型#大数据 +1
关注AI大模型的三大应用场景

过去,人工智能往往局限于特定领域,而大模型凭借其强大的规模扩展性和多任务适应性,打破了这些壁垒,推动人工智能进入新的发展范式。大模型技术引领的新范式,正在推动人工智能走向“通才”,并加速其与各个行业的深度融合,催生众多创新应用场景,推动众多传统行业走向人工智能+。4月27日,中国信通院人工智能研究所副所长魏凯在“算力中关村”技术成果对接交流专场活动上发表《人工智能+的广阔前景与落地之路》的主题演讲

文章图片
#人工智能#搜索引擎#百度
AI大模型如何在企业内落地应用?

AI+”已成为继“软件+”“互联网+”之后,最重要的新质生产力,是今后十年内技术创新和产业升级的核心驱动力。AI大模型技术将重塑千行百业,如何尽快、尽好地将应用大模型技术创造新的核心能力和新的运营服务优势,是所有企业共同面对的机遇和挑战。就是要及时跟进建设自身的AI能力,要在大模型、大数据和大算力这三大要素上,让企业具备不同层次的能力(基础能力、强化能力和创新能力)。就是通过AI大模型技术的运用,

文章图片
#人工智能#自然语言处理#深度学习 +2
    共 813 条
  • 1
  • 2
  • 3
  • 82
  • 请选择