logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【保姆级教程】如何将你的 Coze 智能体,无痛迁移到 Dify?

玩 AI Agent 的朋友,很多都是从 Coze(扣子)开始的。它简单、门槛低,对新手非常友好。但随着我们需求的提升,Coze 的局限性也慢慢显现。比如,有些企业或个人开发者希望,或者想接入,这时候,开源的 Dify 就成了更好的选择。那么问题来了,怎么把我们辛辛苦苦在 Coze 上“调教”好的智能体,顺利迁移到 Dify 呢?今天,我就给大家带来一份实操指南。

#AIGC#人工智能
大模型数据蒸馏实战

大模型数据蒸馏通过将大模型的知识转移到小模型,实现模型压缩、加速推理和降低成本等目标。主要步骤包括选择模型、准备数据、生成软标签和训练学生模型。

文章图片
#深度学习#机器学习#人工智能
如何让AI“看懂”网页?拆解 Browser-Use 的三大核心技术模块

现阶段的 BrowserUse 个人认为它主要是有几个创新点,一个是开创性地构建带标识 Dom 树结构的方式来辅助大模型去理解网页结构和内容,并能通过 index 去精确定位到 clickable 元素,另一个是它串起了 LLM 对于网页内容的理解、next goal 思考、决策路径、action 行动的流程。其本质上还是使用 LLM + Playwright 来实现 AI 操作浏览器,而未来如果

#人工智能#AIGC#开源
超强AI教学智能体!出题阅卷&教学分析一键搞定!

⑯在去除Markdown格式节点后添加已经定义好的mysql查询工具,host填写你要连接的数据库ip,user填写用户名,password填写密码,database填写数据库名称,port填写端口号,query选择去除Markdown格式节点的结果,不返回内容。利用我给你的已知信息,生成可执行的SQL插入到数据库,将已知信息基于表格字段格式要求自行转换格式,其次要把对应字段的完整内容插入数据库中

#人工智能#AIGC
vLLM 0.10重磅更新:性能飙升2.5倍,v1引擎重塑大模型推理体验!

同时,针对升级过程中可能遇到的MoE模型与FP8量化兼容性问题(如"output_size not divisible by block_n"和"start out of range"等错误),提供详细解决方案。MoE模型中moe_intermediate_size(如768)需要被tensor_parallel_size(TP)和block_n同时整除。在您的错误日志中,可以看到大量/vllm/

#人工智能#AIGC
Dify图文回复

节点,下载图片,在回复节点展示图文;如果不包含图片,回复节点只展示文本。对用户的问题进行回答,当回答中包含图片时,将图片在聊天窗口展示出来。节点就是根据用户的输入,从知识库中匹配出最适合的片段,交给下一个。节点中检索出的知识片段,生成符合用户问题的回答。不是本小节重点内容,我们将在之后的小节中详细讲解。的前端展示页面应该是解析的富文本,所以也可以在。下载图片,用户在最后的回复节点中展示。节点就是根

#人工智能#AIGC#开源
使用 LMCache + vLLM 提升 AI 速度并降低 GPU 成本

LMCache 是 vLLM 等运行大型 AI 模型的系统的小助手。它保存这些被称为KV 缓存的东西——基本上是 AI 阅读文本后的便利贴。LMCache 不会每次都涂写新的笔记,而是将它们放在手边,这样你的 AI 就不会浪费时间或消耗昂贵的 GPU 算力。你的 AI 开始以惊人的速度回答问题——有时快七倍,不开玩笑。它使用更少的 GPU 资源,所以你不会因为云账单而哭泣。它非常适合聊天机器人或应

#人工智能#AIGC
人工智能大语言模型微调技术:SFT 、LoRA 、Freeze 监督微调方法

SFT监督微调时监督微调时,学习率通常会设置得很小常见误区:1.监督微调需要大量的训练时间和数据 2.监督微调将复制源模型的所有参数至目标模型 3.监督微调只需要几十条监督数据即可监督微调常见任务:1.用中文预训练BERT模型完成中文实体识别任务 2.训练语言模型GPT3 3.UIE模型在垂直领域的数据集上微调常见误区:在ImageNet上的预训练的模型再来训练目标检测任务 (则不是)目前,主流的

文章图片
#人工智能#语言模型#自然语言处理
在基于图像的深度学习中如何做数据的自动标注以及自动标注的等级介绍

基于图像的AI需要使用标注图像进行训练。这些标注也被称为“ground truth”、“labeled”或“annotated”数据。不同的数据科学模型有多种类型的“标注”。它们各不相同,包括"关键点","插值" ,"姿态估计"等等。

#python#计算机视觉#开发语言
    共 535 条
  • 1
  • 2
  • 3
  • 54
  • 请选择