logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

08 大模型学习——注意力机制

注意力机制 (Attention Is All You Need) ,基础认知及代码实现

文章图片
#python#transformer
21 大模型学习——LangSmith

LangSmith 是 LangChain 提供的 AI 应用开发监测平台,我们可以用它来观察调用链的运行情况。它提供了一系列功能,包括模型调优、数据集管理和结果分析,使用户能够快速迭代并改进其语言模型的性能。LangSmith 还支持与多种流行的深度学习框架集成,简化了模型开发的工作流程,适用于各种 NLP 任务,如文本生成、情感分析和问答系统等。使用 LangSmith,我们可以用它来观察调用

文章图片
#学习#人工智能#python
03 python包管理工具——uv

一个速度极快的 Python 包和项目经理,用 Rust 编写。

文章图片
#python#uv#开发语言
16 大模型学习——LangGraph1

LangGraph 是一个基于LangChain构建的扩展。LangGraph 是一个用于构建具有状态和多参与者应用程序的 LLM 库,它允许创建具有循环的图,这在大多数智能体架构中是必需的。LangGraph提供了对应用程序流程和状态的细粒度控制,这对于创建可靠的智能体至关重要,并且LangGraph 还内置了包括持久化对话,支持高级的人机交互和记忆功能。

文章图片
#学习#人工智能#python
15 大模型学习——Dify平台的介绍与安装

Dify.AI · 生成式 AI 应用创新引擎Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。非技术人员:不懂编程、对大模型不太懂,也可以使用DIFY。

文章图片
#学习#python
02 大模型学习——Ollama

Ollama 是一个开源的大型语言模型服务工具,它旨在简化在本地运行大型语言模型的过程,降低使用大型语言模型的门槛。让用户能轻松下载、运行和管理各种开源的大型语言模型,例如Llama3、Mistral、Qwen2 等。Ollama 支持的模型完全开源免费,任何人都可以自由使用、修改和分发,它的优势在于简单易用、模型丰富以及资源占用低。Ollama 兼容 Windows、Linux 和 MacOS

文章图片
#python
16 大模型学习——LangGraph1

LangGraph 是一个基于LangChain构建的扩展。LangGraph 是一个用于构建具有状态和多参与者应用程序的 LLM 库,它允许创建具有循环的图,这在大多数智能体架构中是必需的。LangGraph提供了对应用程序流程和状态的细粒度控制,这对于创建可靠的智能体至关重要,并且LangGraph 还内置了包括持久化对话,支持高级的人机交互和记忆功能。

文章图片
#学习#人工智能#python
12 大模型学习——LLaMA-Factory微调

Alpaca 格式由斯坦福大学的研究人员提出,主要用于单轮指令微调任务。针对不同任务,数据集的格式要求不同。应用场景:- 适用于单轮任务,如问答、文本生成、摘要、翻译等。- 结构简洁,任务导向清晰,适合低成本的指令微调。

文章图片
#学习#python#人工智能
    共 25 条
  • 1
  • 2
  • 3
  • 请选择