AI小白熊个人主页

@2401_85325726

AI小白熊

2024-09-13 11:15:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

精打细算用好 LLMs ：LLM 落地应用成本及响应延迟优化

LLMs 被视为 AI 领域的一个里程碑式的突破，但要将其应用于实际生产环境，并且还能用对、用好并非易事。模型的使用成本和响应延迟是目前将大语言模型（LLMs）应用于生产环境中的核心难题之一。在本期刊载的这篇文章中，作者从自身项目的实践经验出发，分享了一系列实用技巧，帮助优化 LLM Prompt ，能够一定程度上降低大模型的使用成本和响应延迟。文章首先解析了导致高成本和高延迟的根源在于输入输出

#人工智能 #大数据 #开源 +2

AI大模型 NL2SQL实践系列(1)：深入解析Prompt工程在text2sql中的应用技巧

NL2SQL任务的目标是将用户对某个的自然语言问题转化为相应的SQL查询。随着LLM的发展，使用LLM进行NL2SQL已成为一种新的范式。在这一过程中，如何利用提示工程来发掘LLM的NL2SQL能力显得尤为重要。一个面向复杂任务的prompt的一般都包含Instruction，Context，Input Data，Output Indicator。

#人工智能 #大数据 #搜索引擎 +2

【大模型实战】Lora微调在金融场景中的应用与技巧解析

通过学习大模型课程，可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术，从而提升自己在数据处理、分析和决策制定方面的能力。此外，大模型技术在多个行业中的应用日益增加，掌握这一技术将有助于提高就业竞争力，并为未来的创新创业提供坚实的基础。这里进行lora微调的效果是比官方的p-tuning v2效果好的，并且没有出现严重的知识遗忘特点，比如问题你是谁，他能回答自己是chatglm blabl

#金融 #人工智能 #产品经理 +2

LLM 大模型学习必知必会系列(十一)：大模型自动评估理论和实战以及大模型评估框架详解

大语言模型（LLM）评测是LLM开发和应用中的关键环节。目前评测方法可以分为人工评测和自动评测，其中，自动评测技术相比人工评测来讲，具有效率高、一致性好、可复现、鲁棒性好等特点，逐渐成为业界研究的重点。

#学习 #人工智能 #机器学习 +2

这可能是2024最全面的人工智能学习路线，适合新手和大学生

人工智能已经成为了现代技术的重要组成部分，所以开发人员学习人工智能是非常必要的。人工智能是未来的趋势：人工智能已经成为了未来技术的趋势，它将会在各个领域发挥重要作用，包括医疗、金融、交通、教育等等。人工智能可以提高开发效率：人工智能可以自动化一些重复性的工作，比如数据分析、图像识别等等，这样可以提高开发效率，减少开发时间和成本。人工智能可以提高产品质量：人工智能可以通过分析数据和模式来预测和避免错

#人工智能 #学习 #产品经理 +1

大模型想落地，先让大家用得起

自2023年开始，全球范围掀起了以大模型为代表的生成式AI浪潮。过去一年，但凡和算力、算法、数据、网络安全、云计算、AI相关的企业和题材，都在AI大模型题材的风口上，被追捧上了天。但从技术革新的角度看，国产大模型并没有给生产生活方式带来质的改变。前不久，李开复在一场采访中直言不讳地指出，对于美国人来说，“ChatGPT时刻”发生在17个月前，但中国用户却还在翘首以待属于自己的“AI时刻”。‍归根结

#人工智能 #自然语言处理 #语言模型

久旱逢甘露：当云计算开抢大模型客户

此前，据界面新闻报道，在对觊觎已久的大模型客户Minimax“竞标”中，阿里云、百度云、火山引擎、腾讯云纷纷伸出橄榄枝，把价格打到最低，最终Minimax花落腾讯云，因为在当时，腾讯云有足够的英伟达芯片。过去，云计算主要卖算力，看速度、看存储。如果说在此前，处于存量市场、疲于奔命的云计算行业已经讲不出什么新故事，只能互相挖墙脚谋生、致力于把对方的客户迁到自家云上，整个行业“货拉拉化”，那么大模型无

#云计算 #人工智能 #自然语言处理 +1

深入解析四大LLM模型：预训练到后训练的新范式全攻略

在查看 https://arxiv.org/abs/2407.10671中讨论的预训练和后训练方法之前，我们先简要总结一些核心规格。Qwen 2 模型有5种类型。有4个常规（密集）LLM，参数量分别为5亿、15亿、70亿和720亿。此外，还有一个57亿参数的专家混合模型，其中有14亿参数同时被激活。（由于架构细节不是这次的重点，我不会深入讨论专家混合模型；简而言之，这类似于Mistral AI的M

#数据库 #架构 #面试 +2

到底了