logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文入门垂域模型 SFT 微调

你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里

文章图片
#人工智能#算法#深度学习 +3
大模型落地路线图研究报告(2024年)(附下载)

它涵盖了从基础设施、数据资源到算法模型、应用服务,再到安全可信的全方位分析,旨在帮助各行业明晰业务发展需求,设计合理的大模型建设方案,并通过实践案例展示了大模型在实际应用中的潜力和效果。落地挑战与路线图:报告识别了大模型在落地过程中面临的挑战,如技术选型、工程实践的复杂性,并提出了一套包括现状诊断、能力建设、应用部署和运营管理的落地路线图。行业应用场景:报告详细讨论了大模型在不同行业中的应用场景,

文章图片
#github#人工智能#产品经理 +1
Seed校招博士自述:我为什么选择来字节做大模型

我是一个方向比较独特的博士,做的是音乐生成。今年年底四年顺利毕业,最后的选择是:接了字节 Seed 的 offer,在工业界继续进行研究。逛知乎的这个方向的同行们应该多少读过我在知乎写的鸟瞰 ISMIR 知乎专栏系列。个人主页 https://ldzhangyx.github.io/人工智能可以作曲吗?如何看待中央音乐学院首招音乐人工智能方向博士生?更广泛来说人工智能在音乐领域的应用与前景?虽然

#人工智能
大模型基础:基本概念、Prompt、RAG、Agent及多模态

随着大模型的迅猛发展,LLM 作为人工智能的核心力量,正以前所未有的方式重塑着我们的生活、学习和工作。无论是智能语音助手、自动驾驶汽车,还是智能决策系统,大模型都是幕后英雄,让这些看似不可思议的事情变为可能。本文将从以下5个方面介绍大模型相关内容:1. LLM基础知识3. RAG的应用4. Agent的应用5. 多模态模型。

文章图片
#深度学习#人工智能#产品经理 +2
大家都说通义大模型好,究竟好在哪?

都说国产大模型“通义千问”能打,到底是真强还是智商税?今天就带你看看,这个国产“AI猛将”凭什么火出圈!如今的AI领域竞争激烈,提到大模型,许多人第一反应可能是GPT、Llama等大牌“选手”。然而,阿里巴巴的“通义千问”却让不少开发者拍案称好。今天,我们就来一起揭开通义千问的“好”是如何做到的。2023年4月,阿里巴巴推出通义千问,选择了“全开源”的策略,成为全球开发者关注的焦点。

文章图片
#java#人工智能#android +1
一文说清大模型微调的6种方法!

是在大规模数据上进行无监督或自监督学习训练得到的模型。例如在自然语言处理中,像 BERT(Bidirectional Encoder Representations from Transformers)、GPT(Generative Pretrained Transformer)系列等都是典型的预训练模型。这些模型通过学习大量文本数据中的语言模式、语义信息和语法结构等知识,形成了对语言的深度理解能

文章图片
#人工智能#java#android +1
使用 DeepSeek 和 Ollama 搭建一个本地知识库系统(包含完整代码)

用这个系统,你可以轻松地从 PDF 里提取信息,像跟人聊天一样问问题。赶紧试试吧,释放 AI 的潜力!我的DeepSeek部署资料已打包好(自取↓)但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!❗️为什么你必须了解大模型?1️⃣ 薪资爆炸:应届大模型工程师年薪40万起步,懂“Prompt调教”的带货主播收入翻3倍2️⃣ 行业重构:金融、医疗、教育

文章图片
#人工智能#架构#自然语言处理 +2
再发布!哈佛医学院又一病理大模型TITAN

近日,哈佛医学院再次取得病理大模型突破性进展,发布全新开源多模态全切片基础模型TITAN,它通过视觉自监督学习以及与相应病理报告的视觉-语言对齐,在无需任何微调也不要求临床标签的情况下,能够提取通用的切片表示,并生成可推广到资源有限临床场景(如罕见疾病检索和癌症预后)的病理报告,克服现有模型的局限,为病理学研究和临床实践提供更有效的工具。

文章图片
#人工智能#音视频#开源 +1
一文读懂AI大模型:从入门到精通的全景解析

目前大部分的模型架构都是decode-only(casual LM),少量的有encode-decode,encode-only,为啥大部分LLM是decode-only的,原因可能是以下几点:从mask的角度看,decode-only的输入是一个对角矩阵,对角矩阵是满秩矩阵,表达能力更强。在计算softmax时,假如x=[1,3,2,4],分成2块,第一块[1,3],取最大值3,[-2, 0],

文章图片
#人工智能#产品经理#开源 +1
太强了!10大开源大模型!

近期,Meta 隆重推出了两款开源模型:Llama 3 8B与Llama 3 70B,这两款模型可供外部开发者免费使用。Meta 表示,Llama 3 8B和Llama 3 70B在目前同体量模型中,展现出卓越的性能,堪称业界的佼佼者。从Meta 分享的基准测试结果来看,Llama 3 400B+ 的实力不容小觑,其性能已逼近Claude超大杯以及新版GPT-4 Turbo,虽然还存在一定的差距,

文章图片
#开源#人工智能
    共 389 条
  • 1
  • 2
  • 3
  • 39
  • 请选择