logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

只需一句代码将chatgpt、rag知识库嵌入你的网站,拥有一个网站智能助手

MaxKB = Max Knowledge Base,是一款基于大语言模型和 RAG 的开源知识库问答系统,广泛应用于企业内部知识库、客户服务、学术研究与教育等场景。

文章图片
#人工智能
AI看舌苔?我用通义千问开发了个老中医(前后端 + OpenAI库)

所有的项目都是基于 TailwindCSS 实现了响应式,同时支持网页端和移动端的显示效果。这期尝试开发的 AI 应用是使用通义千问的大模型 API,开发一个 AI 看舌苔的应用。整个项目的操作流程比较简单,第一屏用户上传自己的舌头的照片, 保存到 OSS 中。然后将 OSS 保存的图片发送给通义千问的大模型(这里采用了 qwen-vl + qwen-max 两个大模型),让大模型生成我们的前端

文章图片
#人工智能#AI
新手小白如何搭建一个像openai一样的本地大模型(步骤多版本)

Ollama安装大模型1.安装ollama(本教程以win10系统为例)(1)下载地址:https://ollama.com/打开后进入以下下载地址下载windows版本ollama,其它系统选择对应版本如下图:下载后直接运行安装即可,安装好后右下角会显示一个羊驼的小图标(注意:ollama一般默认自动安装在C盘,后期如果下多个大模型,有的同学可能会面临空间不够,这里可以使用我找到的这个方法,如果

文章图片
#人工智能#语言模型
揭秘大语言模型训练加速利器MindSpeed-LLM,让效率飙升

MindSpee-LLM是昇腾AI面向大模型分布式训练提供的语言大模型套件,仓库涵盖了模型、算法以及各类开发工具链,支持开箱即用及灵活组装开发。仓库配备了详细的使用指南和示例代码,欢迎加入和体验:​。

文章图片
#语言模型#人工智能#自然语言处理
【embedding 神经网络】神经网络算法 —— Embedding(嵌入)!!

本文将从 Embedding 的本质、Embedding的原理、Embedding的应用三个方面,详细介绍Embedding(嵌入)。

文章图片
#神经网络#算法#人工智能
docker-compose本地部署FastGPT与简单使用

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景!FastGPT 是开源项目,遵循附加条件 Apache License 2.0 开源协议,可以Fork之后进行二次开发和发布。FastGPT 社区版将保留核心功能,商业版仅在社区版基础上使用 API 的形式进行扩展,不影响学习

文章图片
#docker#容器#运维
深度学习 Transformer 的标签平滑(Label Smoothing)

01标签平滑(Label Smoothing)是一种正则化技术,用于深度学习中的分类任务,尤其是在Transformer模型中。它的目的是减少模型对于训练数据中硬标签(hard labels,即标准的one-hot编码)的过度自信,从而提高模型的泛化能力并减少过拟合。02在传统的分类任务中,模型的输出通常通过softmax函数转换为概率分布,然后使用交叉熵损失函数与硬标签(one-hot编码)进行

文章图片
#深度学习#transformer#人工智能
大语言模型从零开始训练全面指南:预训练、Tokenizer训练、指令微调、奖励模型、强化学习

在这篇文章中,我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练(Pretrain)、Tokenizer 训练、指令微调(Instruction Tuning)、奖励模型(Reward Model)和强化学习(RLHF)等环节。

文章图片
#人工智能#自然语言处理
手把手教你用LangChain自动写SQL做数据分析可视化

从数据库里拿到原始数据后,我们得给用户生成一个人类能看懂的自然语言响应。这就得利用语言模型的能力,把原始数据转换成容易理解的内容。我们可以写一个函数,它接收(用户问题)、schema(结构)、sql(SQL 查询)、datatemplate = """根据表结构、问题、SQL 查询和 SQL 响应,提供一个结构化的、人类可读的响应。仅提取响应中可用的字段,并正确格式化它们。{schema}问题:{

#sql#数据分析#人工智能
微调一个自己的大模型(腾讯云cloud studio + llama factory)

最近就是新项目和老项目一起支撑,老项目的人以为我还在支撑,然后新项目的人以为我不在支撑老项目了。本来我还乐呵呵的两边一起支撑,后来领导突然问我怎么还在干老项目,让我把老项目的事情交给另一个同事去干。感觉有点吃力不讨好之后,我直接完全不管老项目了,在我的签名上直接加上了老项目支撑=〉xx同事。新项目这边之前干过一个星期,有点基础,上手也挺快。这周当了两天测试,当了几天开发,解了一个问题单。具体的话就

文章图片
#腾讯云#云计算#人工智能 +2
    共 454 条
  • 1
  • 2
  • 3
  • 46
  • 请选择