logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

精打细算用好 LLMs :LLM 落地应用成本及响应延迟优化

LLMs 被视为 AI 领域的一个里程碑式的突破,但要将其应用于实际生产环境,并且还能用对、用好并非易事。模型的使用成本和响应延迟是目前将大语言模型(LLMs)应用于生产环境中的核心难题之一。在本期刊载的这篇文章中,作者从自身项目的实践经验出发,分享了一系列实用技巧,帮助优化 LLM Prompt ,能够一定程度上降低大模型的使用成本和响应延迟。文章首先解析了导致高成本和高延迟的根源在于输入输出

文章图片
#人工智能#大数据#开源 +2
AI大模型 NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧

NL2SQL任务的目标是将用户对某个的自然语言问题转化为相应的SQL查询。随着LLM的发展,使用LLM进行NL2SQL已成为一种新的范式。在这一过程中,如何利用提示工程来发掘LLM的NL2SQL能力显得尤为重要。一个面向复杂任务的prompt的一般都包含Instruction,Context,Input Data,Output Indicator。

文章图片
#人工智能#大数据#搜索引擎 +2
【大模型实战】Lora微调在金融场景中的应用与技巧解析

通过学习大模型课程,可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术,从而提升自己在数据处理、分析和决策制定方面的能力。此外,大模型技术在多个行业中的应用日益增加,掌握这一技术将有助于提高就业竞争力,并为未来的创新创业提供坚实的基础。这里进行lora微调的效果是比官方的p-tuning v2效果好的,并且没有出现严重的知识遗忘特点,比如问题你是谁,他能回答自己是chatglm blabl

文章图片
#金融#人工智能#产品经理 +2
LLM 大模型学习必知必会系列(十一):大模型自动评估理论和实战以及大模型评估框架详解

大语言模型(LLM)评测是LLM开发和应用中的关键环节。目前评测方法可以分为人工评测和自动评测,其中,自动评测技术相比人工评测来讲,具有效率高、一致性好、可复现、鲁棒性好等特点,逐渐成为业界研究的重点。

文章图片
#学习#人工智能#机器学习 +2
这可能是2024最全面的人工智能学习路线,适合新手和大学生

人工智能已经成为了现代技术的重要组成部分,所以开发人员学习人工智能是非常必要的。人工智能是未来的趋势:人工智能已经成为了未来技术的趋势,它将会在各个领域发挥重要作用,包括医疗、金融、交通、教育等等。人工智能可以提高开发效率:人工智能可以自动化一些重复性的工作,比如数据分析、图像识别等等,这样可以提高开发效率,减少开发时间和成本。人工智能可以提高产品质量:人工智能可以通过分析数据和模式来预测和避免错

文章图片
#人工智能#学习#产品经理 +1
大模型想落地,先让大家用得起

自2023年开始,全球范围掀起了以大模型为代表的生成式AI浪潮。过去一年,但凡和算力、算法、数据、网络安全、云计算、AI相关的企业和题材,都在AI大模型题材的风口上,被追捧上了天。但从技术革新的角度看,国产大模型并没有给生产生活方式带来质的改变。前不久,李开复在一场采访中直言不讳地指出,对于美国人来说,“ChatGPT时刻”发生在17个月前,但中国用户却还在翘首以待属于自己的“AI时刻”。‍归根结

文章图片
#人工智能#自然语言处理#语言模型
久旱逢甘露:当云计算开抢大模型客户

此前,据界面新闻报道,在对觊觎已久的大模型客户Minimax“竞标”中,阿里云、百度云、火山引擎、腾讯云纷纷伸出橄榄枝,把价格打到最低,最终Minimax花落腾讯云,因为在当时,腾讯云有足够的英伟达芯片。过去,云计算主要卖算力,看速度、看存储。如果说在此前,处于存量市场、疲于奔命的云计算行业已经讲不出什么新故事,只能互相挖墙脚谋生、致力于把对方的客户迁到自家云上,整个行业“货拉拉化”,那么大模型无

文章图片
#云计算#人工智能#自然语言处理 +1
深入解析四大LLM模型:预训练到后训练的新范式全攻略

在查看 https://arxiv.org/abs/2407.10671中讨论的预训练和后训练方法之前,我们先简要总结一些核心规格。Qwen 2 模型有5种类型。有4个常规(密集)LLM,参数量分别为5亿、15亿、70亿和720亿。此外,还有一个57亿参数的专家混合模型,其中有14亿参数同时被激活。(由于架构细节不是这次的重点,我不会深入讨论专家混合模型;简而言之,这类似于Mistral AI的M

文章图片
#数据库#架构#面试 +2
到底了