logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Agent 工程的成本控制:把 API 费用降下来的系统性方法

只返回前后各 1000 字,中间省略summary = content[:1000] + "\n...[内容已截断]...\n" + content[-1000:]优化四:历史压缩这是 02 篇讲过的 context 管理,这里给出具体实现:“”"保留最近 N 轮对话,其余压缩为摘要“”"return messages# 消息不多,不需要压缩# 需要压缩的历史# 用 LLM 压缩历史请将以下对话历

#人工智能#python#大数据
DeepSeek API是什么

DeepSeek API 是一个提供人工智能服务的接口,它允许开发者通过简单的API调用来实现各种高级的自然语言处理(NLP)任务,如文本生成、对话系统、文本摘要、问答系统等。DeepSeek API 通常基于先进的大模型,如Transformer架构的模型,提供了强大的语言理解和生成能力。

#python#算法
deepseek技术细节1

首先,需要理解token是什么,大模型中的token是指什么?

文章图片
#人工智能
deepseekLLM发展历程

这种优化不仅提高了推理效率,还使得模型能够在更大的上下文长度下运行,支持 128K tokens 的上下文长度,极大地提升了模型在处理长文本任务时的能力。多 token 预测(MTP)机制是 DeepSeek V3 的一大亮点,将预测范畴拓展至每个位置的多个后续 token,采用顺序预测维持因果链,在训练时借助特定模块与损失计算强化模型对多 token 信息的捕捉与学习能力,推理阶段虽可独立运行,

文章图片
#人工智能#python
2025年语音识别(ASR)与语音合成(TTS)技术趋势分析对比

基于Mamba架构的ASR模型,利用结构化状态空间模型(SSM)有效建模时间依赖关系,实现了在多个标准数据集上的SOTA性能。:OpenAI发布的多语言ASR模型,使用68万小时的多语言数据进行训练,支持多任务和多语言的语音识别。一个完整的语音系统往往既需要听得懂(ASR),也需要说得像人(TTS)。文本转语音(TTS)技术将书面文本转换为自然流畅的语音,广泛应用于有声读物、语音助手、播客制作等领

#语音识别#人工智能
1.1 机器人发展历史与背景

传统的人工智能——比如你手机里的语音助手、ChatGPT——它们主要处理的是。

#机器人
智能体agent概述

由Anyscale开发的分布式计算框架,Ray的Agent系统是一个完整的分布式AI框架,它整合了强化学习、模型服务和分布式训练等多个关键组件。该框架的核心功能包括专门执行特定任务的AI单元、允许智能体之间无缝转换任务的交接机制、定义标准化工作流程的例程系统,以及实现智能体与外部系统交互的函数调用能力。CAMEL框架旨在设计实用的通用人工智能,作为最早的基于大型语言模型的多Agent框架,现在是一

文章图片
#人工智能
什么是 Agent 的 Message

什么是 Agent 的 Message?当你和朋友聊天、在网上搜索信息或是对手机语音助手说“帮我查一下天气”时,其实你都在向某个“代理者(Agent)”发送一条“信息(Message)”。这里的“代理者”既可以是一个人,也可以是一个能执行指令的智能程序或系统,而“信息”则是你传递的指令、问题或数据。在日常生活中,这种信息交互常常不易察觉,但在计算机科学、人工智能和自动化任务中,“Agent的Mes

#人工智能#python
探索多种方案下 LLM 的预训练性能

如下图左边所示,当 GPU 内存不足以满足其相应的模型数据要求时,即使当时CPU上仍有可用内存,系统也会崩溃。在像 GPT-2 这样的预训练语言模型上,Sophia 与 Adam 相比,在减少了 50% step 数量的情况下实现了相同的验证预训练损失,这相当于总计算量减少了 50%,wall-clock 时间减少了 50%。Gemini 还利用了深度学习网络训练过程的迭代特性,将迭代分为warm

文章图片
#深度学习#人工智能
    共 178 条
  • 1
  • 2
  • 3
  • 18
  • 请选择