溜溜程序员个人主页

@2301_76225313

溜溜程序员

2024-10-10 17:34:30 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

“我王多鱼投了！”疯狂烧钱的AI大模型公司如何赚钱？

AI大模型到底有多烧钱？或许最有发言权的就是OpenAI了，2022年其亏损大约翻了一番，达到约5.4亿美元。据悉，Altman曾私下建议，OpenAI可能会在未来几年尝试筹集多达1000亿美元的资金，以实现其开发足够先进的通用人工智能。国内的AI公司也不例外。不完全统计，国内头部AI公司智谱AI、百川智能、零一万物、MiniMax和月之暗面，从去年下半年至今已完成了总额超30亿美元的融资，当然，

#人工智能 #深度学习 #AIGC +1

LLM高效微调详解-从Adpter、PrefixTuning到LoRA_llm高效微调技术

目前NLP主流范式是在大量通用数据上进行预训练语言模型训练，然后再针对特定下游任务进行微调，达到领域适应（迁移学习）的目的。指令微调是预训练语言模型微调的主流范式，其目的是尽量让下游任务的形式尽量接近预训练任务。从而减少下游任务和预训练任务之间的Gap, 实现预训练语言模型适应下游任务，而非下游任务去适应模型指令微调的效果要优于基于Zero/Few-shot的提示词工程的上下文学习。但随着预训练语

#人工智能 #深度学习 #机器学习 +2

一文彻底整明白，基于Ollama工具的LLM大语言模型Web可视化对话机器人部署指南

Ollama。

#语言模型 #前端 #机器人 +2

【AI大模型】应用开发基础，学到就是赚到！零基础入门到精通，看完这篇就足够了~

1、了解大模型能做什么2、整体了解大模型应用开发技术栈3、浅尝OpenAI API的调用AI全栈工程师：懂AI、懂编程、懂业务的超级个体，会是AGI（Artificial General Intelligence 通用人工智能）时代最重要的人。

#人工智能 #AIGC #深度学习 +1

带你了解火遍全网的“AI大模型”看完这篇就够了~

在聊到AI的时候，我们都离不开“大模型”这三个字。百度李彦宏说：大模型改变世界；360周鸿祎说：大模型是新时代“发电厂”；李开复博士说：AI大模型是不能错过的历史机遇；……那么，究竟什么是大模型？今天我想和你深度聊聊，欢迎和我链接，一起探讨大模型的更多可能性。

#人工智能 #自然语言处理 #深度学习 +1

【大模型微调】一文掌握7种大模型微调的方法

本篇文章深入分析了大型模型微调的基本理念和多样化技术，细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景，使得读者可以依据特定的应用要求和计算资源限制，挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段：阶段一：预训练阶段在这个阶段，大型模型会在大规模的无

#深度学习 #人工智能 #自然语言处理 +3

【AI大模型】羊驼大模型详解_零基础入门到精通，看完这篇就足够了~

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。原生的基础LLaMa用的语料是通用语料。微调的本质并不是能把模型效果变好，微调的目的是让模型更适应于我们的数据。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智

#人工智能 #深度学习 #产品经理 +1

大模型处理长上下文方法一览_大模型处理上下文

2023年中开始，各大LLM厂商开始关注到长上下文的问题。2023年5月，Claude把长度支持到100k tokens；6、7月的时候，ChatGPT3.5也已经支持16k，而ChatGLM2-B最大长度已经可以到32k。（插一句，ChatGLM系列做得一直很不错，从基础模型、长窗口、工具调用、Agent都一直保持在比较前沿的水平，个人最近用ChatGLM3、ChatGLM4体验还是很不错的）差

#深度学习 #学习 #人工智能 +1

实战微软新一代RAG：GraphRAG强大的全局理解能力，碾压朴素RAG？

大语言模型（LLM）是在大量数据上训练，但他们并不是在我们私有数据上训练，因此要想让LLM能够回答我们私有数据集上的问题，我们就得使用一种叫做检索增强生成（RAG）的技术。它的基本原理是加载我们的文档，然后将每个文档按照一定的规则，比如Token数量、字符数量、语义和层次分割等，将每个文档拆分为一个一个小片段（chunk）。然后使用嵌入技术对这些chunk生成embeding，存储到高维向量数据库

#microsoft #微信 #人工智能 +2

大模型微调到底有没有技术含量？

今天给大家带来知乎好友@ybq的一篇回答-大模型微调到底有没有技术含量，或者说技术含量到底有多大？老生常谈的一句话吧：有没有技术含量取决于这个工作你怎么做，尤其是 llm 方向，上手门槛相比传统 NLP 变得更低了。我举一些例子吧，针对大模型微调的几个重要环节，我列举的每一种做法大概率都能完成最终目标，甚至说训出来的模型效果都没什么差别。但对个人能力成长的帮助就大不相同了。

#人工智能 #AIGC #学习

共 60 条

请选择