logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2025 AI圈年度回顾:每月大事件盘点

2025年度盘点AI领域回顾:技术突破与商业化挑战并存 2025年AI领域呈现爆发式发展,国内外企业展开激烈竞争。年初国产开源模型DeepSeek-R1和MiniMax-01系列引发全球开源热潮,随后海外巨头OpenAI、谷歌相继推出升级产品。技术突破显著:语音转文字实现高精度识别,多模态进入音视频原生时代,轻量化模型降低应用门槛。然而,商业化进程遭遇瓶颈:GPT-5表现不及预期,隐私争议频发,人

文章图片
#人工智能#AI
Clawdbot(Moltbot)源码部署全实测:从环境搭建到 WebChat 验证,避坑指南收好

近期 Clawdbot(Moltbot)走红,为搭建私人 AI 助手,本文记录其 Windows 环境下基于 WSL2 的源码部署全流程及踩坑经验。从 Node.js(需≥22 版本)安装、源码拉取、pnpm 依赖配置,到 OpenClaw 向导配置、网关重启,再到常用命令操作及 WebChat 配对测试,逐一拆解关键步骤。重点梳理权限错误、端口冲突、依赖编译失败、配置文件遗漏等常见问题及解决方案

文章图片
#人工智能
大模型最新面试题系列:深度学习基础(二)

对于一个多分类问题,假设有CCC个类别,样本xxx的真实标签为yyy(用one - hot编码表示),模型的预测概率分布为y\hat{y}y​,其中yi\hat{y}_iy​i​表示样本xxx属于第iii类的预测概率。L−∑i1Cyilog⁡yiL−∑i1C​yi​logy​i​对于一个回归问题,假设样本 (x) 的真实值为 (y),模型的预测值为y\hat{y}y​LMSE1n∑i1n。

#人工智能#pytorch#python +1
Clawdbot(Moltbot)源码部署全实测:从环境搭建到 WebChat 验证,避坑指南收好

近期 Clawdbot(Moltbot)走红,为搭建私人 AI 助手,本文记录其 Windows 环境下基于 WSL2 的源码部署全流程及踩坑经验。从 Node.js(需≥22 版本)安装、源码拉取、pnpm 依赖配置,到 OpenClaw 向导配置、网关重启,再到常用命令操作及 WebChat 配对测试,逐一拆解关键步骤。重点梳理权限错误、端口冲突、依赖编译失败、配置文件遗漏等常见问题及解决方案

文章图片
#人工智能
DeepSeek-R1-0528 模型最新发布:编程推理能力跃升

2025年5月28日,深度求索正式发布开源推理模型DeepSeek-R1-0528,在编程能力、复杂推理和长时思考等核心指标上实现重大突破。该模型基于660B参数的MoE架构优化,通过动态路由策略提升推理速度至26token/s,并实现30-60分钟的连续推理能力。在代码生成和数学推理任务中表现优异,接近商业顶级模型水平。采用MIT许可证开源策略,同步发布6个蒸馏版本,显著降低企业应用成本。其创新

#DeepSeek#AI
DeepSeek为何能低算力实现高性能模型?

在人工智能领域,在有限算力条件下实现高性能模型一直是研究热点。Deepseek 通过一系列创新技术,成功打造出低算力成本高性能的模型,为该领域带来新的突破,下面将详细介绍其实现方式。

#人工智能#pytorch#python +1
大模型最新面试题系列:微调篇之微调框架(一)

克隆仓库创建虚拟环境安装依赖pip install modelscope -U # 国内用户推荐命令行训练(示例)YAML配置文件(以为例)### model### methodstage: sft### train。

#人工智能#面试
大模型最新面试题系列:微调篇之微调基础知识

本文是大模型面试系列中微调篇的基础知识部分,重点介绍大模型微调技术中的一些常用算法,数据标注方法,微调参数设置等内容,旨在帮助读者快速掌握大模型微调的技术技术。

#面试#人工智能
AI技术圈最新技术速览【2025年8月】

2025年8月,全球AI技术加速演进,呈现多元化发展态势。OpenAI推出双轨战略,发布推理旗舰GPT-5和非监督学习模型GPT-4.5;谷歌升级Gemini 2.5系列,强化多模态能力;微软测试自研模型MAI-1,寻求技术独立性;Cohere发布企业级翻译模型,强调数据安全。开源社区也取得突破,oLLM库实现低成本长上下文推理。这些进展表明,AI正从通用模型竞争转向多元化生态,推动技术向应用场景

文章图片
#人工智能#DeepSeek
    共 37 条
  • 1
  • 2
  • 3
  • 4
  • 请选择