logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

fastadmin 安装注意事项

目录安装phpstudy​phpstudy 站点配置访问配置界面https://www.bilibili.com/video/BV1Ji4y1V7ZV?p=4&spm_id_from=pageDriverphpstrom简介 PHP即“超文本预处理器”,是一种通用开源脚本语言。而PhpStorm 是 JetBrains 公司开发的一款商业的 PHP 集成开发工具。所以phpstrom是用来

文章图片
#html5#html#java
智能工单处理系统:Gemini大模型赋能

本文介绍了一个基于Google Gemini大模型的智能工单处理与标注系统,该系统集成了Agent工具调用能力。系统核心功能包括工单智能分类与标注、电商RAG增强和Agent自然语言交互。通过LLM工具调用(Function Calling)实现技能调度,采用"LLM智能决策+规则引擎兜底"的混合架构,在工单类型检测、标签生成等环节使用LLM判断,而在电商知识库检索、型号判断等

文章图片
#人工智能#金融#语言模型 +2
视觉token生成革命:ViT切块 vs VQ-VAE全局编码

1. **本质区别**:ViT切块是**物理分割+局部编码**,每个token只对应图像的一个固定区域;VQ-VAE全图编码是**卷积融合+全局编码**,每个token都包含整个图像的上下文信息。2. **核心优势**:VQ-VAE解决了ViT切块的三大致命问题:- 硬边界导致的物体分割错误- 平均池化导致的信息丢失- 局部梯度导致的训练不充分3. **未来趋势**:VQ-VAE已经成为原生多模态

#深度学习#人工智能#机器学习 +3
多模态大模型:如何理解图文语义鸿沟

1.**1024×1024→256个视觉token**是计算成本、信息保留和模态平衡之间的**黄金平衡点**,不是硬性规定2.VQ-VAE视觉分词器是**全卷积架构**,天生支持**任意分辨率**的图像输入3.对于大图片,主流解决方案是**动态token压缩**和**滑动窗口注意力**,最新技术是**按需放大**4.未来的发展方向是**自适应分辨率编码**:模型会根据任务需求,自动选择最合适的分辨

文章图片
#大数据#人工智能#机器学习 +2
反事实视觉语言微调:解决VLM两大顽疾

摘要:反事实视觉语言微调(CF-VLM)是2025年提出的创新技术,通过构建"事实-反事实"对比样本增强VLM的因果推理能力。该方法针对传统VLM依赖统计关联而非真实视觉理解的问题(如颜色误判、空间关系混淆),利用扩散模型生成关键属性修改的反事实图像,训练模型识别视觉因果关系。CF-VLM在组合推理任务上提升5-10%性能,降低30%视觉幻觉率,但面临反事实样本生成质量、模型过

#人工智能#深度学习#计算机视觉 +3
扩散模型是什么: 擅长生成图像、视频、音频、3D点云等

摘要: 扩散模型是一种基于逐步去噪的生成式AI模型,擅长生成图像、视频、音频等连续型高维数据。其核心原理包括前向扩散(逐步加噪)和反向扩散(神经网络去噪)。相比GAN,扩散模型训练更稳定、生成质量更高、扩展性更好。与LLM相比,扩散模型处理连续数据,采用并行生成方式,以UNet为主架构,训练目标是预测噪声。两者的深度融合是未来AI的核心趋势,包括LLM指导扩散模型提升可控性、扩散模型增强VLM减少

文章图片
#音视频#3d#人工智能 +1
中科院1区AI期刊推荐,速发免版面费

这篇文章推荐了6本中科院1区/JCR Q1的计算机领域SCI期刊,涵盖人工智能、神经科学等方向。NEURAL NETWORKS、IEEE TRANSACTIONS ON FUZZY SYSTEMS等期刊无版面费,审稿周期最短2-3个月(PATTERN RECOGNITION)。APPLIED SOFT COMPUTING国人占比超60%,PATTERN RECOGNITION年发文量966篇。In

文章图片
#人工智能#copilot#架构 +2
AI Agent Skill 技能实战:计算器模块详解

摘要: Skill是AI Agent中可调用的独立功能模块,具有明确的输入输出接口,用于扩展LLM的能力(如计算、查询等)。以计算器Skill为例,其核心是安全执行数学表达式,通过AST白名单机制(仅允许数字和基本运算符节点)防止恶意代码注入。代码解析展示了如何定义Skill函数、描述接口,并模拟Agent调用流程:检测用户需求→调用Skill→返回结果。整个过程强调安全性与功能性的平衡。

#人工智能#算法#机器学习 +1
AI Agent Skill 技能实战:计算器模块详解

摘要: Skill是AI Agent中可调用的独立功能模块,具有明确的输入输出接口,用于扩展LLM的能力(如计算、查询等)。以计算器Skill为例,其核心是安全执行数学表达式,通过AST白名单机制(仅允许数字和基本运算符节点)防止恶意代码注入。代码解析展示了如何定义Skill函数、描述接口,并模拟Agent调用流程:检测用户需求→调用Skill→返回结果。整个过程强调安全性与功能性的平衡。

#人工智能#算法#机器学习 +1
    共 171 条
  • 1
  • 2
  • 3
  • 18
  • 请选择