logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文搞懂全连接层

全连接层是深度学习模型的重要组成部分,尤其在卷积神经网络中起到了关键作用。通过合理设计输入和输出维度,并结合激活函数、Dropout 等技术,全连接层能够有效地完成各种任务,如分类、回归和生成等。理解和掌握全连接层的使用方法,对于构建高效的深度学习模型至关重要。

文章图片
一文搞懂激活函数

激活函数通过引入非线性特性,使得神经网络能够学习复杂的模式和特征。ReLU: 简单高效,适合大多数场景。: 改善了 ReLU 的“死亡神经元”问题。: 适合特定任务(如 RNN),但容易导致梯度消失。Softmax: 常用于多分类任务。Swish: 性能优越,适合深层网络。根据任务需求选择合适的激活函数,并结合其他组件(如卷积层、归一化层等),可以构建高效的深度学习模型。

文章图片
#深度学习
DeepSeek-R1技术解析

deepseek-ai/DeepSeek-R1 (github.com)[2501.12948v1] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (arxiv.org)[DeepSeek-R1: Incentivizing Reasoning Capability in LLM

文章图片
#DeepSeek
PyTorch深度学习实战

pytorch深度学习实战

文章图片
#深度学习
Gin版本的路由总结

本文介绍了从FastAPI切换到Gin框架的开发经验,特别适合单人全栈开发场景。文章详细展示了Gin的路由模块实现方案,包括:1)项目目录结构设计;2)主路由配置(main.go);3)多版本路由分组管理(routers/v1);4)控制器实现。通过gin.Default()创建引擎,使用Group()实现路由分组,演示了/v1/todo和/v1/user等API路由的注册方式,并提供了基础的控制

#开发语言#gin
【破解】是langsmith在局域网可以让其他人使用

给公司开发了基于langgraph的跨境电商客服系统,已经封装了接口给我们的网站提供服务。但是为了内部给大家科普我的工作内容,发现并不是太容易,使用LangSmith不充值,无法在他人电脑上使用,于是就研究了一下方案,本地启动dev模式,局域网内电脑访问我的电脑ip就可以实现查看流程了,非常便捷。

文章图片
PocketBase的自定义任务【专供LLM请求耗时任务】

本文介绍了使用PocketBase快速构建客服系统的经验。针对算法岗位开发者面临的前后端支持不足问题,PocketBase提供了轻量级解决方案,支持通过JavaScript钩子实现自定义逻辑。文章详细讲解了PocketBase的定时任务配置、多种钩子类型(包括服务启动、记录操作、文件上传等)及其应用场景,并提供了实战案例代码。重点说明了如何利用pb_hooks.js文件扩展系统功能,如自定义API

文章图片
Go-qdrant-API开启客服系统新模式

本文介绍了使用Go语言对接Qdrant向量数据库的接口实现,包含客户端创建、集合管理、数据操作等核心功能。主要内容包括:1.客户端连接配置;2.集合创建与列表查询;3.数据增删改查操作;4.多向量空间支持;5.带过滤条件的查询。提供了完整的代码示例,可用于开发客服系统等需要向量检索的应用场景。接口通过HTTP(3334)和gRPC(3335)端口访问,支持单点和批量操作。

文章图片
文章图片
一文搞懂Embedding

是 PyTorch 中非常重要的模块,用于将离散的符号(如单词)映射为连续的向量表示。通过合理地选择和,并结合预训练的词向量,可以显著提升模型的性能。

文章图片
    共 11 条
  • 1
  • 2
  • 请选择