AI程序猿人个人主页

@python1222_

AI程序猿人

2024-07-23 14:05:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

5个简单好用的本地运行大模型的方法

像ChatGPT、Claude.ai和phind这样的聊天机器人非常有用，但可能并不总是希望的问题或敏感数据由外部应用程序处理。在平台上尤其如此，在这些平台上，你的互动可能会被人类审查，并以其他方式用于帮助训练未来的模型。一种解决方案是下载一个大型语言模型（LLM）并在自己的机器上运行它。这样一来，外部公司就永远无法访问的数据。这也是尝试一些新专业模型的一个快速选择，如Meta最近宣布的Code

#人工智能 #机器学习 #语言模型 +1

用上这10条神指令（prompt)，让ChatGPT快速写出优质高分科研论文

1、阅读并消化指定标题的研究论文内容，提供一个简洁明了的总结，包括主要发现、方法、结果和研究意义。2、确保总结对一般读者友好，同时保留原文的核心见解和细节。

#人工智能 #计算机视觉

大语言模型训练部署流程及步骤

事实上，技术进步能够给我们带来的好处是，变量X的提高使得我们训练模型所需要的时间正在逐步减少，因此对于搭建自有的大模型来说，训练多大的规模参数就需要有多大规模的算力。初代大模型的推出是具有跨时代的意义，这不仅仅是让人们充分利用到大语言模型的便利性，也为更多大语言的推出铺平了道路，例如：ChatGPT训练了几乎所有能在公开渠道找到的数据，包括全部的推特数据（事实上，今年马斯克已经限制了推特API的采

#人工智能 #自然语言处理

深度 | 9款GPU横评，哪些适合大模型训练，哪些适合推理任务？

对比分析NVIDIA 的 H100、A100、A6000、A4000、V100、P6000、RTX 4000、L40s、L4 九款GPU，哪些更推荐用于模型训练，哪些则更推荐用于推理。在 AI 领域，有两大场景对 GPU 的需求最大，一个是模型训练，另一个是 AI 推理任务。但是很多人多可能在最开始为自己的项目做 GPU 选型时，都很难判断哪些 GPU 适合做模型训练，哪些 GPU 更适合去做推理

#人工智能 #深度学习 #GPU

一文彻底搞懂深度学习 - 损失函数（Loss Function）

衡量预测结果与真实结果之间差异的函数。它通过计算模型的回归损失和分类损失99，回归损失主要处理连续型变量，常用等，对异常值敏感度不同；分类损失主要处理离散型变量，常用等，适用于不同分类任务需求。**

#深度学习 #人工智能 #产品经理

吴恩达LangChain教程：Embedding与文档解析

想要依据Embedding实现文本检索，需要引入如下的依赖。其中，RetrievalQA的作用是对一些文档进行检索，CSVLoader将用于加载一些我们与LLM结合的以CSV格式存在的专有数据，DocArrayInMemorySearch是一种向量存储，也是一种内存中的向量存储，不需要连接到任何外部数据库。案例中提供了一个户外服装数据的CSV，使用CSVLoader实现数据加载。然后引入Vecto

#人工智能

大模型RAG实战｜向量数据库：Elasticsearch实现混合检索（附完整代码）

大模型RAG实战系列文章，带你深入探索使用LlamaIndex框架，构建本地大模型知识库问答系统。本系列涵盖知识库管理、检索优化、模型本地部署等主题，通过代码与实例，讲解如何打造生产级系统，实现本地知识库的快速检索与智能问答。当时，我们采用的向量数据库是，作为LlamaIndex中的向量存储（Vector Store）。Chroma是一个非常简单易用的嵌入式向量数据库，在开发和测试场景非常受欢迎。

#elasticsearch #人工智能 #自然语言处理

翻译|解开LLMs的神秘面纱：他们怎么能做没有受过训练的事情？

LLMs是在大量文本数据上进行训练的人工智能系统，使它们能够生成类似人类的行为，并以传统机器学习模型无法做到的方式理解自然语言。“这些模型使用深度学习领域的先进的tricks，涉及多层深度神经网络的训练，用于学习复杂的模式和关系。”GitHub Copilot团队的机器学习高级研究员John Berryman解释道。LLMs的独特之处在于它们擅长概括和理解上下文。他们不受预定的规则或模式的限制，而

#人工智能 #产品经理

告别繁琐搜索！我用 Marscode 简单实现了一个定制 AI 新闻聚合工具

作为一个经常写代码的程序员，我深深体会到这个概念有多香。想想看，不用配环境、不用担心电脑配置，打开浏览器就能 coding，这不就是我们梦寐以求的开发体验吗？最爽的是，云端 IDE 让我的开发方式变得超级灵活。简直不要太香 - 地铁上掏出手机看看代码，午休时用平板改改 bug，回到家用电脑继续开发，所有代码状态都完美同步。再也不用担心"诶呀，那段代码是不是忘在公司电脑上了"这种问题。而且的特性简直

#人工智能 #自然语言处理 #深度学习 +2

GraphRAG：基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践

在语义相似性中，例如，数据被表示为由AI嵌入模型生成的数值向量，这些向量试图捕捉其含义。数据分为两部分，一部分为图数据(data/import目录)，包含了人员(Executive), 产业(Industry), 股票(Stock), 概念（Concept）等点以及人员-股票，股票-概念，股票-产业之间的关联关系，这部分数据以图的方式存储到PolarDB中。在 GraphRAG 中，知识图谱作为

#知识图谱 #php #自然语言处理 +2

共 20 条

请选择