人肉推土机个人主页

@zhangzhentiyes

人肉推土机

2023-02-23 10:19:35 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI技术圈最新技术速览【2025年9月】

2025年9月标志着AI大模型（LLMs）和智能体（Agents）技术进入了工业化部署的新阶段。本月，技术圈的关注点已从单纯的模型规模竞赛，转向解决实际应用中至关重要的三大难题：计算效率、深层认知可靠性和复杂的流程编排。研究界和产业界的技术突破集中在利用LLM的推理能力来优化整个AI应用生命周期的各个阶段。

通过。

2025年8月，全球AI技术加速演进，呈现多元化发展态势。OpenAI推出双轨战略，发布推理旗舰GPT-5和非监督学习模型GPT-4.5；谷歌升级Gemini 2.5系列，强化多模态能力；微软测试自研模型MAI-1，寻求技术独立性；Cohere发布企业级翻译模型，强调数据安全。开源社区也取得突破，oLLM库实现低成本长上下文推理。这些进展表明，AI正从通用模型竞争转向多元化生态，推动技术向应用场景

#人工智能 #DeepSeek

AI技术圈最新技术速览【2025年8月】

#人工智能 #DeepSeek

Qwen最新多模态大模型：Qwen2.5-Omni介绍与快速入门

近日，Qwen2.5-Omni正式发布了！这是Qwen系列中全新的旗舰级端到端多模态大模型，专为全面的多模式感知设计，无缝处理包括文本、图像、音频和视频在内的各种输入，同时支持流式的文本生成和自然语音合成输出。Qwen2.5-omni 的发布，在人工智能领域掀起了波澜，其创新性的技术架构为多模态交互带来了前所未有的变革。下面我们深入剖析其核心技术，理解它是如何重塑多模态交互格局的。

#pytorch

大模型最新面试题系列：微调篇之微调框架（一）

克隆仓库创建虚拟环境安装依赖pip install modelscope -U # 国内用户推荐命令行训练（示例）YAML配置文件（以为例）### model### methodstage: sft### train。

#人工智能 #面试

大模型最新面试题系列：模型部署（二）

通过修改中的generate# 原有代码...# 添加自定义处理逻辑custom_output = process_chunk(chunk) # 自定义处理函数在加载模型时，某些模型可能会依赖于一些自定义的代码逻辑。例如，一些模型使用了特殊的架构或者自定义的前向传播方法，这些代码并不是库中默认支持的。当你使用参数时，vLLM 会允许从远程源加载并执行这些自定义代码。这样就能让 vLLM 顺利加载和

#人工智能 #面试

手把手教你部署QWQ模型，开启高效推理之旅

在大语言模型蓬勃发展的当下，掌握模型的本地部署与调用技术，对于开发者深入探索模型性能、实现个性化应用至关重要。本文将以QWQ-32B模型为例，详细阐述其部署与调用的全流程，为大家提供一份全面且具有实操性的技术指南。

大模型最新面试题系列：深度学习基础（二）

对于一个多分类问题，假设有CCC个类别，样本xxx的真实标签为yyy（用one - hot编码表示），模型的预测概率分布为y\hat{y}y，其中yi\hat{y}_iyi表示样本xxx属于第iii类的预测概率。L−∑i1Cyilog⁡yiL−∑i1Cyilogyi对于一个回归问题，假设样本 (x) 的真实值为 (y)，模型的预测值为y\hat{y}yLMSE1n∑i1n。

#人工智能 #pytorch #python +1

大模型最新面试题系列：深度学习基础（二）

#人工智能 #pytorch #python +1

共 25 条

请选择