logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文读懂 AI Agent!从 “自主决策” 到工具调用,揭秘未来AI智能体的核心原理

AI Agent智能体的核心原理与应用 AI Agent是一种能自主感知、决策和执行的智能实体,区别于依赖提示词的大模型,它通过目标驱动实现任务自动化。其核心技术包括: 任务规划:利用大模型的思维链(Chain of Thought)和思维树(Tree of Thought)分解复杂任务,结合自省机制(如ReAct框架)优化决策; 记忆系统:短期记忆受限于模型上下文窗口,长期记忆通过向量数据库实现

文章图片
#人工智能#DeepSeek#大数据 +1
一文读懂 AI Agent!从 “自主决策” 到工具调用,揭秘未来AI智能体的核心原理

AI Agent智能体的核心原理与应用 AI Agent是一种能自主感知、决策和执行的智能实体,区别于依赖提示词的大模型,它通过目标驱动实现任务自动化。其核心技术包括: 任务规划:利用大模型的思维链(Chain of Thought)和思维树(Tree of Thought)分解复杂任务,结合自省机制(如ReAct框架)优化决策; 记忆系统:短期记忆受限于模型上下文窗口,长期记忆通过向量数据库实现

文章图片
#人工智能#DeepSeek#大数据 +1
视频理解大突破!Video-LLaVA 与 LLaVA-NeXT-Video 双雄争霸,刷新多模态模型性能天花板

北京大学团队推出的Video-LLaVA与LLaVA-NeXT-Video在视频理解领域取得重大突破。Video-LLaVA通过"提前对齐"策略统一图像和视频特征处理,采用两阶段训练显著提升多模态理解能力,在多个视频问答基准测试中创下SOTA记录。LLaVA-NeXT-Video则基于LLaMA3等大模型架构,通过零样本学习和动态规划优化在视频任务中表现优异。两者分别以特征对齐

文章图片
#音视频#人工智能#自然语言处理
视频理解大突破!Video-LLaVA 与 LLaVA-NeXT-Video 双雄争霸,刷新多模态模型性能天花板

北京大学团队推出的Video-LLaVA与LLaVA-NeXT-Video在视频理解领域取得重大突破。Video-LLaVA通过"提前对齐"策略统一图像和视频特征处理,采用两阶段训练显著提升多模态理解能力,在多个视频问答基准测试中创下SOTA记录。LLaVA-NeXT-Video则基于LLaMA3等大模型架构,通过零样本学习和动态规划优化在视频任务中表现优异。两者分别以特征对齐

文章图片
#音视频#人工智能#自然语言处理
自然语言处理系列十六》中文分词》分词工具实战》CRF++工具包实战

此文章有有陈敬雷老师的清华大学出版社配套书籍教材【自然语言处理原理与实战(人工智能科学与技术丛书)】https://item.jd.com/13951851.html和【分布式机器学习实战(人工智能科学与技术丛书)】,对应京东自营链接地址:https://item.jd.com/12743009.html

文章图片
#算法#人工智能#python +2
Coze与Dify终极对决:AI智能体开发平台怎么选?

本文对比了AI智能体开发平台Coze与Dify的核心差异。Coze是字节跳动推出的零代码平台,主打简易操作和快速搭建,适合个人轻量级应用及字节生态用户;Dify则是开源平台,提供深度定制和私有化部署,适合企业级复杂场景。两者在功能、价格、技术架构等方面各有优劣,建议根据技术基础、应用场景和合规需求选择。总体而言,Coze适合快速验证想法,Dify适合深度开发,两者可互补使用。

文章图片
#人工智能#python#机器学习 +1
大数据部门各个职位的职业生涯规划和发展路径

从职业发展路径来看,一般可以分两个路线来走,一个是专业技术路线,也叫T序列,另一个是管理路线,也叫M序列,每个序列都分很多级别。T序列一般职位从低到高是工程师、资深工程师、架构师/专家、高级架构师/高级专家、资深架构师/资深专家、首席架构师/首席专家/首席科学家等,当然每个公司的叫法可能不太一样,但大同小异。T序列一般主攻技术,当然级别高了也会带团队,只是T序列带的团队人数,比同级别的M序列带的人

文章图片
#算法#机器学习#编程语言 +2
从单图识别到多图对话,阿里多模态大模型 Qwen-VL 系列凭什么成为多模态 AI 新标杆?

阿里巴巴推出的通义千问多模态大模型Qwen-VL系列,包括Qwen-VL、Qwen-VL-Chat等版本,具备强大的图像识别、多语言对话、多图交互和细粒度理解能力。该系列在多项国际测评中表现优异,支持448分辨率输入,成为首个开源的中文开放域定位通用模型。文章详细介绍了模型推理和微调方法,包括代码示例和数据处理流程,展示了其在视觉语言任务中的灵活应用。Qwen-VL系列标志着中国在多模态AI领域的

文章图片
#人工智能#机器人#机器学习
从单图识别到多图对话,阿里多模态大模型 Qwen-VL 系列凭什么成为多模态 AI 新标杆?

阿里巴巴推出的通义千问多模态大模型Qwen-VL系列,包括Qwen-VL、Qwen-VL-Chat等版本,具备强大的图像识别、多语言对话、多图交互和细粒度理解能力。该系列在多项国际测评中表现优异,支持448分辨率输入,成为首个开源的中文开放域定位通用模型。文章详细介绍了模型推理和微调方法,包括代码示例和数据处理流程,展示了其在视觉语言任务中的灵活应用。Qwen-VL系列标志着中国在多模态AI领域的

文章图片
#人工智能#机器人#机器学习
解锁 DALL・E 3:文生图多模态大模型的无限可能

OpenAI推出的DALL·E 3是第三代文生图多模态大模型,相比前代在语义理解、图像质量和长文本处理等方面有显著提升。其技术架构分为图像描述生成和图像生成两大模块:前者结合CLIP图像编码器和GPT语言模型实现精准描述;后者通过变分自编码器压缩图像、T5文本编码和潜空间扩散等技术生成高质量图像。评估显示,DALL·E 3在CLIP分数、Drawbench复杂提示处理等指标上优于同类模型。文章还提

文章图片
#人工智能#python
    共 204 条
  • 1
  • 2
  • 3
  • 21
  • 请选择