logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

免费开源!3 秒克隆声音、100%本地运行,AI 配音进入原生桌面时代

开源AI语音工具Voicebox正改变行业格局,提供免费本地化替代方案。相比ElevenLabs等云端付费服务,Voicebox具备三大优势:1)完全开源免费;2)100%本地运行保障隐私;3)集成语音克隆、输入输出等全功能。支持7种TTS引擎和50+预设音色,3秒即可克隆声音,并具备跨平台支持、AI语音交互、多音轨编辑等创新功能。技术栈采用Tauri框架+Python后端,GitHub星标超2.

文章图片
#人工智能#神经网络#深度学习
大模型训练的隐藏密码:超参数与学习率完全指南

《大模型训练中的超参数与学习率详解》一文深入解析了机器学习模型训练的核心要素。文章首先区分了模型参数与超参数的概念,指出超参数是训练前设定的配置变量,如同烹饪前的菜谱规则。重点讲解了神经网络的关键超参数体系,包括学习率、批大小、隐藏层数量等,其中学习率被比作下山时的"步幅",过大过小都会影响训练效果。文章详细介绍了学习率的三种状态及其影响,并提供了四种优化方法:网格搜索、学习率

文章图片
#学习#人工智能#深度学习 +3
RNN 循环神经网络模型解剖——核心机制与数学原理

这篇文章深入浅出地讲解了循环神经网络(RNN)的核心原理。RNN与传统神经网络的关键区别在于其能够处理序列数据,通过记忆机制理解时间上下文关系。文章通过生动的比喻(如做菜类比)和可视化展示,详细拆解了RNN的结构和数学公式,重点阐述了其记忆传递机制、参数共享设计以及激活函数的作用。RNN通过隐藏状态h在不同时间步传递信息,使网络能够记住之前的内容并做出更准确的预测。这种设计使其特别适合处理语言模型

文章图片
#人工智能#深度学习#神经网络
挑战 Claude,字节跳动重磅推出豆包Seed-Code:AI编程革命来袭!

火山引擎推出AI编程助手Doubao-Seed-Code,具备256K超长上下文处理能力、视觉理解生成功能,支持设计稿直接转代码。性能超越国内同类产品,接近顶级模型ClaudeSonnet4.5,兼容主流开发工具并大幅降低成本,5分钟生成《我的世界》副本仅需0.2元。该模型通过强化学习和沙盒环境训练,为开发者提供高效协作编程体验,现可通过低价订阅服务快速接入。

文章图片
#人工智能
互联网不用 HTML,会长什么样?无限翻页的画册,AI 画出来的浏览器

摘要:Flipbook是一款实验性工具,通过AI实时生成图像替代传统网页的HTML代码和超链接。用户点击屏幕上的像素化内容时,系统会生成新图像进行信息探索,实现无页面跳转的视觉化浏览。其多模型系统结合网络搜索数据,按需渲染文字、图表等内容。与传统网页相比,Flipbook以图像为载体,实现个性化内容呈现。目前仍存在文字渲染错误、高算力消耗等问题,但展现了未来视觉化互联网的潜力,支持从信息获取到直接

文章图片
#人工智能#AI
从原理到工程实践:一文彻底讲透梯度下降 & SGD

梯度下降是深度学习的核心优化算法,通过迭代调整参数最小化预测误差。文章从基础原理出发,阐释了梯度下降如何像"下山"一样寻找最优解,比较了批量梯度下降、随机梯度下降和小批量梯度下降的特点。随着深度学习发展,出现了Adam等自适应优化器,解决了局部最小值、梯度消失等挑战。如今小批量梯度下降配合Adam已成为工业标准,推动着从简单回归到大型语言模型的训练。理解梯度下降的演变历程,就掌

文章图片
#人工智能#神经网络#深度学习
DeepSeek V4:百万上下文时代的架构革命,论文深度解析

DeepSeek V4技术突破解析:开源模型首次实现高效百万Token上下文处理 【核心创新】 CSA+HCA混合注意力机制: CSA采用4:1压缩+Top-k选择策略,使1M Token序列计算量降至27% HCA实现128倍压缩,提供全局低分辨率感知 混合架构实现KVCache仅需基线2%存储 mHC残差连接: 通过双随机矩阵约束解决61层极深网络训练稳定性 Sinkhorn-Knopp算法2

文章图片
#人工智能#神经网络#深度学习 +1
DeepSeek V4:百万上下文时代的架构革命,论文深度解析

DeepSeek V4技术突破解析:开源模型首次实现高效百万Token上下文处理 【核心创新】 CSA+HCA混合注意力机制: CSA采用4:1压缩+Top-k选择策略,使1M Token序列计算量降至27% HCA实现128倍压缩,提供全局低分辨率感知 混合架构实现KVCache仅需基线2%存储 mHC残差连接: 通过双随机矩阵约束解决61层极深网络训练稳定性 Sinkhorn-Knopp算法2

文章图片
#人工智能#神经网络#深度学习 +1
Hermes Agent 深度解析:会自我进化的 AI Agent 究竟有多强?

导读:2026 年,AI Agent 这条赛道突然拥挤起来。OpenClaw 横空出世拿下 GitHub 历史最高星数,Hermes Agent 随即以截然不同的哲学登场。很多人看着这些名词一头雾水——它们和 Claude Code 有什么区别?和 MCP 又是什么关系?本文先把这张地图画清楚,再深入拆解 Hermes Agent 的每一个核心机制。编辑:公众号:人工智能研究Suo。

文章图片
#人工智能#深度学习#神经网络
Hermes Agent 深度解析:会自我进化的 AI Agent 究竟有多强?

导读:2026 年,AI Agent 这条赛道突然拥挤起来。OpenClaw 横空出世拿下 GitHub 历史最高星数,Hermes Agent 随即以截然不同的哲学登场。很多人看着这些名词一头雾水——它们和 Claude Code 有什么区别?和 MCP 又是什么关系?本文先把这张地图画清楚,再深入拆解 Hermes Agent 的每一个核心机制。编辑:公众号:人工智能研究Suo。

文章图片
#人工智能#深度学习#神经网络
    共 154 条
  • 1
  • 2
  • 3
  • 16
  • 请选择