logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文搞懂什么是向量嵌入Embedding?

一起来开个脑洞,如果诸葛亮穿越到《水浒传》的世界,他会成为谁?武松、宋江、还是吴用?这看似是一道文学题,但我们可以用数学方法来求解:诸葛亮 + 水浒传 - 三国演义 =?文字本身无法直接运算,但是如果把文字转换成数字向量,就可以进行计算了。而这个过程,叫做“向量嵌入”。因为具有语义意义的数据(如文本或图像),人类可以分辨它们的相关程度,但是无法量化,更不能直接计算。例如,对于一组词“诸葛亮、刘备、

文章图片
#人工智能#机器学习#算法 +2
大模型应用系列:从MLOps到LLMOps

【引子】在IT领域中,DevOps 是软件工程效能的重要方法论以及工具集, 在人工智能领域同样如此。MLOps 和 LLMOps 都是管理机器学习系统的方法。MLOps 致力于解决机器学习生命周期的生产问题,促进数据科学家和运营专家之间的合作,提高机器学习系统的效率和质量。LLMOps 通过结合“终身”学习扩展了 MLOps,使机器学习模型能够随着时间的推移不断地从新数据中学习和改进,从而使数据快

文章图片
#深度学习#数据库#开发语言 +1
科研界的“哥白尼时刻“已到来!AMD的Agent Laboratory能自己查文献、写论文、整代码

🌈重磅:发表于昨天的论文《Agent Laboratory: Using LLM Agents as Research Assistants》对于科研界具有划时代意义,过去几周才能完成的科研任务现在仅需20分钟到一两个小时左右(不同LLM),花费2-13个美金的Token即可完成!惊不惊喜,意不意外?这不仅是一篇关于AI的论文,更是AI对自身能力的一次完整展示和深度剖析。科研领域有了AI的加持进

文章图片
#深度学习#数据库#开发语言 +1
理解RAG系统的十大核心组件

01当我刚开始构建大语言模型应用时,以为添加实时上下文只需在提示词后附加几段文字。事实远非如此。要打造可靠、准确且可用于生产环境的系统,意味着必须重新设计从输入处理到可观测性的每个环节。这正是检索增强生成(RAG)技术带来革命性突破的关键所在。RAG系统绝非简单的智能提示包装器,而是由多个动态部件组成的全栈式处理流程。若想让人工智能产品具备可解释性、可扩展性且基于事实,就必须透彻掌握RAG系统的核

文章图片
#人工智能#大数据#算法 +2
货拉拉等发布LalaEval:面向领域大模型的端到端人工评测框架

领域范围界定:MECE 原则、后向归纳法、定性优先级划分。能力指标构建:6 个通用能力指标,6 个领域能力指标。评测集生成:原始语料积累、QA 对生成、质检和入库。评测标准制定:打分标准(0~3分)、单盲测试、评测员的培训。结果统计分析:评分计算、争议度分析(评分人和题目)、评分波动分析。

文章图片
#人工智能#transformer#计算机视觉 +2
收藏必备!AI大模型微调项目保姆级教程:从零基础到面试通关,这一篇就够了!

本文分享如何将AI大模型微调项目"营销"给面试官,强调数据质量与多样性比数量更重要,建议自制独特数据集体现业务思维;提倡科学评测模型效果而非主观感受;指出调参不如优化数据,应采用"case驱动"方法。通过深度思考和项目包装,新人算法工程师可超越简单复现项目的竞争者,展现业务潜力与创新能力。声明:本文含大语言模型生成内容为0,图片则使用Dall-E3生成。

#人工智能#面试#职场和发展 +3
smolagents:Hugging Face 开源的Agent框架,用代码驱动 Agent 的新思路

Hugging Face 向来对开发者用户理解深入,加上它社区的优势,它发布的很多框架都能够获得不错的反响,

文章图片
#深度学习#数据库#开发语言 +1
计算DeepSeekV3训练的MFU

本文利用公开信息推导得到,相比V2的MFU提升大概60%,希望对后续技术讨论提供数据支撑。自2024年12月发布以来,DeepSeekV3在人工智能领域引发了广泛关注。该模型不仅被国内三大顶会公众号上连篇累牍报道,更在海外社交媒体平台X等渠道引发热议。其关键因素之一在于突破性的训练成本控制——仅用557万美元便训练出了性能达到SOTA水平的模型。这一成就不仅引发业界对AI模型训练成本效益的重新思考

文章图片
#聚类#机器学习#人工智能 +2
利用LLM重新审视金融情感分析

在当今数字化时代,社交媒体平台上的信息传播速度极快,影响力也日益增强。一条来自公众人物的推文就可能在几分钟内引发全球市场数十亿美元的资金流动。随着市场的发展,投资者群体的心理和行为对市场走势的影响愈发显著。投资者情绪通常反映在推特等社交媒体平台上,成为市场预期的代理指标。金融情感分析(FSA)旨在量化这些情绪,并将其分类为看涨(Bullish)、看跌(Bearish)或中性(Neutral),以预

文章图片
#金融#大数据#算法 +4
大模型infra实战|上百个Lora动态部署

朋友说他遇到了一个大模型技术难题,请我吃顿饭看看,能不能帮我解决下。行,一听技术难题我就来劲了。见了面后,直接问我,你这啥场景啊,100个lora。说来话长,我们做角色扮演的,最早写写prompt,通过遵循指令定义人设,日子也勉强过的下去。你这不挺好的么,干嘛老想部署自己的模型,现在基座都这么强了。这种方法天花板不高,也不安全,特别是在一些非知名人物的设定上,有自己的人设语料微调的小模型效果更好。

文章图片
#python#数据库#开发语言 +3
    共 875 条
  • 1
  • 2
  • 3
  • 88
  • 请选择