logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LangChain的使用和Deepseek的私有化部署

本文介绍了LangChain框架与Transformer架构的学习应用,以及DeepSeek-R1模型的部署实践。主要内容包括:1)LangChain作为开源LLM应用框架,通过模块化组件简化开发流程,演示了调用星火大模型API的实例;2)Transformer的核心技术解析,重点阐述自注意力机制和多头注意力原理;3)DeepSeek-R1论文研究成果,展示其通过强化学习提升的推理能力,并详细说明

文章图片
#人工智能#AIGC#论文阅读 +2
豆包插件+arxiv的论文阅读应用

点了之后,点击上方翻译全文,就可以看到中英文对照的论文,并且边上还可以对ai提问,真是一举三得。然后右上角会有豆包的AI阅读标识(要先安装豆包插件chorm 和 edge 都是支持的)Arxiv:非常好用的论文库(https://arxiv.org/)搜索Attention Is All You Need(论文题目)选择CS方向,或者直接在搜索框中搜索需要的论文类型,方向等。点右边的view PD

文章图片
#论文阅读#人工智能#深度学习 +1
数据挖掘入门-二手车交易价格预测

在这里,定义了一个XGBoost回归模型,使用了特定的超参数:1.n_estimators:集成中的提升轮数或决策树数量(本例中有120棵树)。2.learning_rate:防止过拟合的步长缩减。3.gamma:需要进一步划分叶子节点的最小损失减小量。4.subsample:用于拟合决策树的样本比例。5.colsample_bytree:用于拟合决策树的特征比例。6.max_depth:每棵树的

文章图片
#数据挖掘#人工智能#python +3
langchain调用星火大模型API构建私有LLM

如果您对讯飞AI能力接入感到无从下手,现在您可以通过阅读这些文档获得帮助。星火认知大模型服务说明 | 讯飞开放平台文档中心。目前langchain支持的星火版本为。(ultra等版本目前还不支持)Spark Max版本。控制台-讯飞开放平台。

文章图片
#人工智能#AIGC
深度学习和计算机视觉(Deep Learning and Computer Vision)

1.计算机视觉的定义计算机视觉(Computer Vision)是一个跨学科的研究领域,主要涉及如何使计算机能够通过处理和理解数字图像或视频来自动进行有意义的分析和决策。其目标是使计算机能够从视觉数据中获取高层次的理解,类似于人类的视觉处理能力。图像分类:识别图像中主要的物体或场景。例如,给定一张图片,确定它是猫还是狗。目标检测:在图像中定位和识别多个目标。例如,在街景图像中识别并标注汽车、行人和

文章图片
#深度学习#计算机视觉#人工智能
深度学习和计算机视觉(Deep Learning and Computer Vision)

1.计算机视觉的定义计算机视觉(Computer Vision)是一个跨学科的研究领域,主要涉及如何使计算机能够通过处理和理解数字图像或视频来自动进行有意义的分析和决策。其目标是使计算机能够从视觉数据中获取高层次的理解,类似于人类的视觉处理能力。图像分类:识别图像中主要的物体或场景。例如,给定一张图片,确定它是猫还是狗。目标检测:在图像中定位和识别多个目标。例如,在街景图像中识别并标注汽车、行人和

文章图片
#深度学习#计算机视觉#人工智能
基于ResNet的垃圾分类系统

ResNet-34深度学习模型实现摘要 本文详细介绍了ResNet-34深度学习模型的实现过程。该模型通过残差连接(BasicBlock结构)解决深度网络中的梯度消失问题,包含34层网络架构。项目分为三个核心模块:模型定义(model.py)、训练(train.py)和预测(predict.py)。 在训练阶段,使用SGD优化器和交叉熵损失函数,实现了100个epoch的训练过程,并保存最佳权重。

文章图片
#分类#数据挖掘#人工智能 +1
langchain调用星火大模型API构建私有LLM

如果您对讯飞AI能力接入感到无从下手,现在您可以通过阅读这些文档获得帮助。星火认知大模型服务说明 | 讯飞开放平台文档中心。目前langchain支持的星火版本为。(ultra等版本目前还不支持)Spark Max版本。控制台-讯飞开放平台。

文章图片
#人工智能#AIGC
Transformer的算法原理和计算流程

《Attention Is All You Need》论文解读,Attention机制(大白话系列),3分钟通俗讲解注意力机制到底怎么乘的,Transformer模型简介,发明Transformer的人真是个天才https://www.bilibili.com/video/BV14m421u7EM/?然后outputs probabilities输出的便是翻译预测的结果(注意:这里的outputs

文章图片
#transformer#算法#深度学习 +1
LangChain的使用和Deepseek的私有化部署

本文介绍了LangChain框架与Transformer架构的学习应用,以及DeepSeek-R1模型的部署实践。主要内容包括:1)LangChain作为开源LLM应用框架,通过模块化组件简化开发流程,演示了调用星火大模型API的实例;2)Transformer的核心技术解析,重点阐述自注意力机制和多头注意力原理;3)DeepSeek-R1论文研究成果,展示其通过强化学习提升的推理能力,并详细说明

文章图片
#人工智能#AIGC#论文阅读 +2
    共 16 条
  • 1
  • 2
  • 请选择