
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
近日,AWS正式推出一款AI驱动的代码编辑器——Kiro。它不是传统意义上的AI写代码工具,而是一款真正意义上的“开发代理人”。目前官网已开放免费下载,支持 macOS、Windows 和 Linux,用户可以免费体验,每月上限 50 次 AI 交互。

微调的本质是利用了迁移学习技术,即从预训练模型开始,通过特定数据集进一步训练以提高特定领域的性能。全微调(Full- Fine-tuning):重新训练整个模型,更新所有参数权重,效果显著但资源密集。参数高效微调(PEFT):仅更新少量参数(如 ),减少计算需求,适合资源有限的企业。常见技术有:LoRA(Low-Rank Adaptation)、QLoRA、P-tuning(前缀调优)、Adapt

定义训练过程,包括损失函数、优化器和训练步骤。

通过SWIFT支持的Agent训练能力,我们使用ms-agent和ms-bench对qwen-7b-chat模型进行了微调。可以看到微调后模型保留了通用知识问答能力,并在system字段增加了API的情况下可以正确调用并完成任务。训练从LoRA变为全参数训练,知识遗忘问题会更加严重,数据集混合比例需要实际测试调整部分模型可能在训练后仍然调用效果不佳,可以测试该模型本身预训练能力是否扎实Agent训

在科技飞速发展的当下,人工智能(AI)已成为推动各行业变革的关键力量。其中,多模态 AI 知识库作为 AI 领域的重要创新,正引领我们迈向一个全新的智能时代。它打破了传统数据处理的单一模式,融合文本、图像、音频、视频等多种数据模态,为我们提供了更加全面、深入的知识理解与应用能力。从日常生活中的智能语音助手,到医疗领域的精准诊断,再到自动驾驶汽车的安全行驶,多模态 AI 知识库的身影无处不在。它不仅

OpenAI 明确了 Agent 的核心特征。它不仅仅是聊天机器人或简单的 LLM 调用,关键在于能够独立执行工作流。Agent 能代表用户,在某种程度上独立地完成一系列步骤以达成目标,无论是订餐、处理客服请求,还是提交代码变更。Agent 的决策核心是LLM 驱动。它利用大模型来管理工作流的执行,做出判断,识别任务何时完成,甚至在必要时主动纠正自己的行为。同时,Agent 需要通过工具与外部世界

思维链技术(Chain of Thought,也简称为CoT),最早由Json Wei等人在Chain-of-Thought Prompting Elicits Reasoning in Large Language Models文章提出。简单来说就是通过提示词让模型能够将一个复杂的问题分步思考。比如举个文章中提到的例子(见下图),一个数学问题是:食堂有 23 个苹果。如果他们用掉了 20 个来做

《AI产品经理实用工具指南》总结了10款提升工作效率的AI神器,涵盖对话模型、编程辅助、设计转换、数据分析和产品管理等领域。核心推荐包括:ChatGPT(全能助手)、Monica(一站式AI生产力)、Trae/Cursor(AI编程工具)、Figma+Cursor(设计转代码方案)等。文章强调AI工具不仅能提升产品经理的日常工作效率,更能在面试中展现对AI趋势的敏感度。同时提供了大模型学习路径,从

Google宣布将AI编程初创公司Windsurf的核心团队纳入DeepMind,重点推进代理式编码研究。虽然未收购股权,但获得技术许可。Windsurf曾是OpenAI的收购目标,谈判破裂后被Google迅速介入。该公司因Claude断供转向Gemini,并完成管理层调整。Windsurf主打Agent IDE产品,年收入超1亿美元,增长迅猛。随着大模型厂商向工具层渗透,独立AI编程工具面临更大

总体来看,虎嗅智库认为当AI对智能客服团队的降本增效成为企业的普遍需求时,企业重点应该放在增效而非降本上。“效”一方面是“效率”,比如在识别用户意图,判断用户情绪,并高效地处理客服应答,Agent客服有不错表现;另一面是“效果”,通过辅助工具,将传统客服转变为具有导购专家、客服专家或金牌客服角色的团队成员,并带动其他人工客服,甚至人工导购。这种双“效”提升,对企业中长期发展是至关重要的。随着AI能
