logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI 从线性回归到神经网络那些事

我们从简单的线性回归出发,一步步深入到复杂的神经网络,这一演进过程展现了机器学习模型的内在逻辑和发展脉络。通过这条路径,我们可以理解每个环节的必要性和连续性。表:从线性回归到神经网络的核心概念演进模型关键创新解决的问题遗留的挑战线性回归建立特征与目标的线性关系连续值预测无法处理非线性与分类问题逻辑回归使用Sigmoid函数输出概率二分类问题本质仍是线性模型激活函数引入非线性变换拟合非线性关系单层模

#人工智能#线性回归#神经网络 +1
在 Flowable 工作流引擎中,如何获取表单数据信息

摘要: Flowable工作流引擎获取表单数据的方法因表单类型(动态/外置)和节点类型(启动/任务/历史)而异。核心方法包括: 启动节点:FormService.getStartFormData()获取表单定义,RuntimeService读取流程变量; 任务节点:FormService.getTaskFormData()查询字段定义,流程变量或历史服务获取提交值; 历史数据:通过HistoryS

#开发语言#工作流
GPT-5的统一引擎与国产模型的MoE架构各有什么优势和局限性

摘要:GPT-5的"统一引擎"与国产模型的MoE架构各具特色。GPT-5通过动态路由Transformer实现多模态深度融合,支持复杂任务链但算力消耗巨大;国产MoE架构(如Qwen)采用稀疏激活机制,计算效率高且易于垂直领域部署,但存在路由稳定性不足等问题。技术对比显示,GPT-5擅长通用多模态任务,国产模型更适合行业纵深应用。未来可能走向技术融合,GPT-5或引入MoE层优

#架构
Android项目里源码是kt格式转java

针对将 Kotlin 文件(如 MainActivity.kt)转换为 Java 代码的完整方案,综合多个技术文档的实现思路

文章图片
#android#java#开发语言 +1
AI神经网络的“灵魂” 常见激活函数 ReLU Sigmoid Tanh

摘要:本文深入介绍了三种常见激活函数(ReLU、Sigmoid、Tanh)的特性与应用。ReLU计算简单、缓解梯度消失,是CNN等现代网络隐藏层的首选;Sigmoid输出(0,1)适合概率输出,但存在梯度消失问题;Tanh零中心化(-1,1),在RNN中表现较好。文章通过函数公式、导数范围、优缺点对比及可视化代码,阐明了不同场景下的选择策略:隐藏层优先ReLU(或变体),输出层根据任务选择Sigm

#神经网络#深度学习
IoT: 物联网(IoT)体系结构

本文系统阐述了物联网四层架构(感知层、网络层、平台层、应用层)的功能和技术实现。感知层负责数据采集,采用传感器、RFID、ZigBee等技术及Arduino等开源硬件;网络层实现数据传输,利用NB-IoT、5G和MQTT等协议;平台层涵盖数据处理和设备管理,使用InfluxDB、Kafka等工具;应用层提供行业解决方案,如智能家居和智慧城市。文章还对比了各层技术,并指出安全、标准化等挑战。开源生态

#物联网
大语言模型(LLM)应用开发平台:Dify

Dify是一个开源大语言模型应用开发平台,融合后端即服务(BaaS)和LLMOps理念,提供低代码/无代码开发环境,支持主流LLM模型和RAG引擎。其核心功能包括知识库构建、Agent工作流编排和多模型兼容,适用于企业知识管理、智能客服等场景。平台支持云服务和本地私有化部署,提供API集成能力,适合需要定制化AI解决方案的企业用户。相比Coze等竞品,Dify在灵活性、私有化部署和复杂任务处理上更

#语言模型#人工智能#自然语言处理 +1
DeepSeek-OCR全面应用指南

摘要 DeepSeek-OCR是DeepSeek AI推出的创新多模态模型,采用"上下文光学压缩"技术实现高效文本处理,在10倍压缩比下精度达97%。该系统支持五种分辨率模式,日处理20万页数据,可识别文档、表格、公式等复杂内容。安装需24GB以上显存GPU和Python 3.12.9环境,提供本地部署和云端服务两种方案。应用场景包括企业文档数字化、学术研究、金融法律等领域,通

#DeepSeek
DeepSeek-OCR:视觉压缩长文本的理论突破与架构解析

摘要: DeepSeek-OCR是DeepSeek AI发布的革命性视觉-文本压缩模型,通过将文本视为连续视觉信号进行高效压缩,突破传统Transformer二次方复杂度限制。其核心架构包括DeepEncoder视觉编码器(3.8亿参数)和MoE解码器(30亿参数,稀疏激活),支持多分辨率动态处理,实现最高20:1的压缩比。训练采用两阶段策略,结合3000万页多语言数据,在文档数字化、知识管理等领

#DeepSeek
Ollama ——开源的本地化大型语言模型(LLM)管理工具

摘要:Ollama是一款开源本地化大语言模型管理工具,支持在个人设备上部署运行Llama 3、DeepSeek等多种开源模型,保障数据隐私。其核心功能包括:本地化模型部署(支持macOS/Linux/Windows)、模型管理(下载/运行/删除)、自定义参数调整及API集成。操作简便,通过命令行即可完成模型交互,适用于开发测试、科研教育及隐私敏感场景。安装时需注意配置存储路径和网络安全,7B以上模

#语言模型#人工智能#自然语言处理
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择