logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【程序员必备】大模型评测太难?字节跳动大神教你“用Agent评Agent“,小白也能成为AI评测专家!

字节跳动数据平台大模型评测团队分享了数据应用Agent领域的评测技术创新与实践,提出三层评测框架(基础能力、组件、端到端效果),针对Text-to-SQL任务开发了基于语义等价的评测方法,创新性地采用"Agent评测Agent"技术,并通过评估平台支撑自动化评测流程,旨在解决大模型应用效果评估难题,提升AI开发效率与质量。

文章图片
#人工智能#数据挖掘#大数据 +2
【程序员必备】大模型评测太难?字节跳动大神教你“用Agent评Agent“,小白也能成为AI评测专家!

字节跳动数据平台大模型评测团队分享了数据应用Agent领域的评测技术创新与实践,提出三层评测框架(基础能力、组件、端到端效果),针对Text-to-SQL任务开发了基于语义等价的评测方法,创新性地采用"Agent评测Agent"技术,并通过评估平台支撑自动化评测流程,旨在解决大模型应用效果评估难题,提升AI开发效率与质量。

文章图片
#人工智能#数据挖掘#大数据 +2
大模型总‘幻觉‘?RAG技术3步解决,小白也能上手,老板看了直呼内行!

本文介绍RAG(检索增强生成)技术,通过"先抽屉后嘴巴"的烹饪比喻,解释如何将知识分割存储为向量,检索相关内容再输入大模型,提高回答准确性和时效性,降低成本和幻觉率。提供简单代码实现和问题解答,让大模型像"自来水"一样提供准确知识服务。

文章图片
#机器学习#人工智能#大数据
大模型总‘幻觉‘?RAG技术3步解决,小白也能上手,老板看了直呼内行!

本文介绍RAG(检索增强生成)技术,通过"先抽屉后嘴巴"的烹饪比喻,解释如何将知识分割存储为向量,检索相关内容再输入大模型,提高回答准确性和时效性,降低成本和幻觉率。提供简单代码实现和问题解答,让大模型像"自来水"一样提供准确知识服务。

文章图片
#机器学习#人工智能#大数据
程序员的福音!大模型Agent让营销活动从“手动挡“变“自动驾驶“,1人顶1团队效率炸裂!

腾讯企点营销云推出MAGIC方法论,通过大模型Agent技术重构营销链路,实现数据底座、增长闭环和AI营销一体化。绝味食品订单转化达人工3.1倍,太平鸟转化率提升20%,证明AI不仅提效,更改变营销分工。三层架构(MAGIC Agent、Customer AI、工具层)让1个运营完成团队工作,开启营销智能化新时代。

文章图片
#大数据#人工智能#机器学习 +2
程序员的福音!大模型Agent让营销活动从“手动挡“变“自动驾驶“,1人顶1团队效率炸裂!

腾讯企点营销云推出MAGIC方法论,通过大模型Agent技术重构营销链路,实现数据底座、增长闭环和AI营销一体化。绝味食品订单转化达人工3.1倍,太平鸟转化率提升20%,证明AI不仅提效,更改变营销分工。三层架构(MAGIC Agent、Customer AI、工具层)让1个运营完成团队工作,开启营销智能化新时代。

文章图片
#大数据#人工智能#机器学习 +2
深度学习五大模型:CNN、Transformer、BERT、RNN、GAN解析

今天探讨它们各自适用的场景,让您知道在何种情况下选择何种模型;同时分析它们的优势与局限,助您全面评估这些模型的性能。

文章图片
#深度学习#cnn#transformer +1
一文彻底搞懂多模态:大语言模型推理,大模型入门到精通!

Chain-of-Thought(思维链,简称CoT)是一种改进的提示技术,旨在提升大型语言模型(LLMs)在复杂推理任务上的表现。Chain-of-Thought要求模型在输出最终答案之前,先展示一系列有逻辑关系的思考步骤或想法,这些步骤相互连接,形成了一个完整的思考过程。Chain-of-Thought可以通过两种主要方式实现:Zero-Shot CoT和Few-Shot CoT。

文章图片
#语言模型#人工智能#自然语言处理
阿里云这波“王炸“!AgentRun让小白程序员也能秒变AI大神,TCO直接干掉60%!Serverless+Agentic AI开发新姿势,代码量砍半,效率拉满!

阿里云发布函数计算AgentRun,一站式Agentic AI基础设施平台,深度融合Serverless弹性与AI场景。提供毫秒级弹性、企业级安全沙箱、模型工具治理、全链路可观测和开放生态五大核心能力,让开发者专注核心逻辑创新。TCO平均降低60%,支持无代码到高代码开发,已服务于阿里云百炼、吉利汽车等企业,加速Agentic AI落地企业生产环境。

文章图片
#阿里云#人工智能#serverless +4
阿里云这波“王炸“!AgentRun让小白程序员也能秒变AI大神,TCO直接干掉60%!Serverless+Agentic AI开发新姿势,代码量砍半,效率拉满!

阿里云发布函数计算AgentRun,一站式Agentic AI基础设施平台,深度融合Serverless弹性与AI场景。提供毫秒级弹性、企业级安全沙箱、模型工具治理、全链路可观测和开放生态五大核心能力,让开发者专注核心逻辑创新。TCO平均降低60%,支持无代码到高代码开发,已服务于阿里云百炼、吉利汽车等企业,加速Agentic AI落地企业生产环境。

文章图片
#阿里云#人工智能#serverless +4
    共 1351 条
  • 1
  • 2
  • 3
  • 136
  • 请选择