
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2025年度盘点AI领域回顾:技术突破与商业化挑战并存 2025年AI领域呈现爆发式发展,国内外企业展开激烈竞争。年初国产开源模型DeepSeek-R1和MiniMax-01系列引发全球开源热潮,随后海外巨头OpenAI、谷歌相继推出升级产品。技术突破显著:语音转文字实现高精度识别,多模态进入音视频原生时代,轻量化模型降低应用门槛。然而,商业化进程遭遇瓶颈:GPT-5表现不及预期,隐私争议频发,人

近期 Clawdbot(Moltbot)走红,为搭建私人 AI 助手,本文记录其 Windows 环境下基于 WSL2 的源码部署全流程及踩坑经验。从 Node.js(需≥22 版本)安装、源码拉取、pnpm 依赖配置,到 OpenClaw 向导配置、网关重启,再到常用命令操作及 WebChat 配对测试,逐一拆解关键步骤。重点梳理权限错误、端口冲突、依赖编译失败、配置文件遗漏等常见问题及解决方案

对于一个多分类问题,假设有CCC个类别,样本xxx的真实标签为yyy(用one - hot编码表示),模型的预测概率分布为y\hat{y}y,其中yi\hat{y}_iyi表示样本xxx属于第iii类的预测概率。L−∑i1CyilogyiL−∑i1Cyilogyi对于一个回归问题,假设样本 (x) 的真实值为 (y),模型的预测值为y\hat{y}yLMSE1n∑i1n。
近期 Clawdbot(Moltbot)走红,为搭建私人 AI 助手,本文记录其 Windows 环境下基于 WSL2 的源码部署全流程及踩坑经验。从 Node.js(需≥22 版本)安装、源码拉取、pnpm 依赖配置,到 OpenClaw 向导配置、网关重启,再到常用命令操作及 WebChat 配对测试,逐一拆解关键步骤。重点梳理权限错误、端口冲突、依赖编译失败、配置文件遗漏等常见问题及解决方案

2025年5月28日,深度求索正式发布开源推理模型DeepSeek-R1-0528,在编程能力、复杂推理和长时思考等核心指标上实现重大突破。该模型基于660B参数的MoE架构优化,通过动态路由策略提升推理速度至26token/s,并实现30-60分钟的连续推理能力。在代码生成和数学推理任务中表现优异,接近商业顶级模型水平。采用MIT许可证开源策略,同步发布6个蒸馏版本,显著降低企业应用成本。其创新
在人工智能领域,在有限算力条件下实现高性能模型一直是研究热点。Deepseek 通过一系列创新技术,成功打造出低算力成本高性能的模型,为该领域带来新的突破,下面将详细介绍其实现方式。
克隆仓库创建虚拟环境安装依赖pip install modelscope -U # 国内用户推荐命令行训练(示例)YAML配置文件(以为例)### model### methodstage: sft### train。
本文是大模型面试系列中微调篇的基础知识部分,重点介绍大模型微调技术中的一些常用算法,数据标注方法,微调参数设置等内容,旨在帮助读者快速掌握大模型微调的技术技术。
2025年8月,全球AI技术加速演进,呈现多元化发展态势。OpenAI推出双轨战略,发布推理旗舰GPT-5和非监督学习模型GPT-4.5;谷歌升级Gemini 2.5系列,强化多模态能力;微软测试自研模型MAI-1,寻求技术独立性;Cohere发布企业级翻译模型,强调数据安全。开源社区也取得突破,oLLM库实现低成本长上下文推理。这些进展表明,AI正从通用模型竞争转向多元化生态,推动技术向应用场景








