logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度信念网络 (DBN) 学习笔记

想象一下,我们想让计算机像人一样“理解”世界,比如识别图片中的猫狗,甚至能“想象”出新的猫狗图片。深度信念网络(Deep Belief Network,简称 DBN)就是早期深度学习领域中,为了实现这个目标而诞生的一种强大模型。简单来说,DBN 是一种深度学习模型,它由多层特殊的“特征提取器”堆叠而成。这些“特征提取器”叫做受限玻尔兹曼机(RBM, Restricted Boltzmann Mac

#学习#深度学习
深度信念网络 (DBN) 学习笔记

想象一下,我们想让计算机像人一样“理解”世界,比如识别图片中的猫狗,甚至能“想象”出新的猫狗图片。深度信念网络(Deep Belief Network,简称 DBN)就是早期深度学习领域中,为了实现这个目标而诞生的一种强大模型。简单来说,DBN 是一种深度学习模型,它由多层特殊的“特征提取器”堆叠而成。这些“特征提取器”叫做受限玻尔兹曼机(RBM, Restricted Boltzmann Mac

#学习#深度学习
理解长短期记忆神经网络(LSTM)

LSTM(长短期记忆网络)通过引入细胞状态和三个门控机制(遗忘门、输入门、输出门),有效解决了传统RNN在长序列处理中的梯度消失和爆炸问题。这种结构使其能够选择性记忆重要信息,在自然语言处理、语音识别等领域表现优异。虽然Transformer等新模型已超越LSTM的部分性能,但LSTM仍是理解序列模型发展的重要里程碑,其门控机制为后续模型提供了关键思路。

#神经网络#lstm#人工智能
卷积神经网络(CNN)学习笔记

CNN是一种用于图像处理的深度学习模型,其核心在于自动特征提取。它通过卷积层捕捉局部特征,池化层降维并增强鲁棒性,全连接层进行最终决策。CNN的优势包括权值共享减少参数量、局部连接模拟视觉机制,以及层级特征学习能力。经典模型如LeNet、AlexNet、ResNet等不断优化网络结构。虽然面临过拟合、计算量大等挑战,但通过数据增强、迁移学习等方法可有效解决。CNN广泛应用于图像分类、目标检测、医学

#cnn#学习#AIGC
[特殊字符] 大模型应用问题解决

【摘要】大语言模型(LLM)应用落地面临五大核心挑战:1)上下文长度受限,需结合文本切分、RAG和多轮对话压缩技术;2)生成结果不可控(幻觉问题),可通过Prompt约束、外部工具调用和验证机制缓解;3)响应速度慢,建议采用流式输出、模型优化和前端加载优化;4)API成本高,推荐使用缓存机制、多模型协同和Token剪枝策略;5)知识更新不及时,需构建定期更新的向量库和外部知识接入系统。最新技术如长

#AIGC
Mixture-of-Experts 架构在大模型中的应用与挑战

摘要:Mixture-of-Experts(MoE)架构通过稀疏激活机制解决了千亿参数大模型的计算瓶颈问题。该架构由门控网络和专家网络组成,仅选择性激活部分专家,在保持模型容量的同时显著降低计算成本。核心优势包括计算效率的指数级提升、推理延迟小幅增长以及多任务模块复用能力。然而MoE面临路由稳定性、训练收敛性和分布式通信成本等挑战,当前研究通过负载均衡损失、专家容量限制等策略进行优化。Google

#人工智能
多模态大模型:迈向“通用人工智能”的关键一步

多模态大模型是AI领域重大突破,通过统一架构同时处理文本、图像、语音等多种数据形式,实现类人综合感知能力。本文系统介绍了GPT-4o、Gemini等代表性模型,解析了其核心技术包括统一Transformer架构、跨模态对齐训练和长上下文支持。多模态AI已在教育、医疗、客服等领域展现巨大潜力,未来将向泛模态感知和世界模型发展,成为通向通用人工智能的关键路径。尽管面临数据稀缺、计算资源等挑战,多模态大

文章图片
#人工智能
Crawl4AI进行异步爬虫并提取链接

本文介绍了一个基于Python的异步网页爬虫项目,用于抓取特定网页内容并提取指定年份的年度报告PDF链接。项目采用asyncio、crawl4ai、OpenAI等技术实现高效爬取和智能分析功能,主要包含三个核心模块:通过AsyncWebCrawler异步爬取网页内容;利用OpenAI模型从Markdown中精确提取符合年份要求的PDF链接;使用aiohttp并发下载文件。系统支持命令行参数指定目标

#爬虫#python
到底了