logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

干货分享!如何评估 大型语言模型(LLMs)的输出质量?评估方法大盘点!

本文探讨了评估LLM输出结果的一些技术,从人工评估到自动化评估。其中:一方面,自动化评估的时间成本效率更高,在某些情况下是非常实用的选择,例如在早期原型设计阶段。另一方面,人工评估仍然是获得模型应用准确性和实用性最强评估标准。每种评估方法都有其优点以及潜在缺陷,这个也要根据具体任务具体分析。​。

文章图片
#服务器#人工智能#自然语言处理
大型语言模型(LLMs)的技术革新:问答对生成与优化实践

在人工智能领域,大型语言模型(LLMs)正以其强大的自然语言处理能力,为各行各业带来革命性的变化。这些模型,如GPT-3、GPT-4以及Llama 2,不仅在文本生成、翻译、摘要等领域展现出卓越的性能,还在问答系统中扮演着至关重要的角色。问答对(Question-Answer pairs, Q&A)的生成是LLMs应用的核心,它直接影响到模型的交互性和实用性,为用户提供准确、相关且及时的信息反馈。

文章图片
#语言模型#人工智能#自然语言处理
收藏必备!AI Agent时代:从理论到实践的21个核心设计模式,智能体系统完全指南

简单来说,AI智能体是一个能够感知环境并采取行动以实现特定目标的系统。它是大语言模型(LLM)的进化版本,增强了规划、使用工具和与环境交互的能力。接受任务:你给它一个目标,如"整理我的日程"扫描环境:收集所有必要信息——读取邮件、检查日历、访问联系人制定计划:思考实现目标的最佳方法执行行动:发送邀请、安排会议、更新日历学习改进:观察结果并适应调整,持续优化这种循环机制让AI智能体能够像人类助手一样

文章图片
#人工智能#设计模式#AI +1
收藏必备!AI Agent时代:从理论到实践的21个核心设计模式,智能体系统完全指南

简单来说,AI智能体是一个能够感知环境并采取行动以实现特定目标的系统。它是大语言模型(LLM)的进化版本,增强了规划、使用工具和与环境交互的能力。接受任务:你给它一个目标,如"整理我的日程"扫描环境:收集所有必要信息——读取邮件、检查日历、访问联系人制定计划:思考实现目标的最佳方法执行行动:发送邀请、安排会议、更新日历学习改进:观察结果并适应调整,持续优化这种循环机制让AI智能体能够像人类助手一样

文章图片
#人工智能#设计模式#AI +1
AI智能体开发宝典:从理论到代码,打造能解决问题的数字助手

智能体(Agent)是一个能够代表用户,以高度独立性完成任务(Workflow) 的系统。它能理解用户目标,自主选择行动路径,并利用外部工具执行任务。简单来说,它是“能帮你做事的AI”,而不仅仅是“能和你聊天的AI”。比如你告诉它“帮我分析最新销售数据,并生成周报”,它不会仅仅生成报告模板,而会:1.查询数据库 → 2. 分析关键指标 → 3. 生成图表 → 4. 写出总结报告 → 5. 邮件发送

文章图片
#人工智能#oracle#数据库 +1
AI智能体开发宝典:从理论到代码,打造能解决问题的数字助手

智能体(Agent)是一个能够代表用户,以高度独立性完成任务(Workflow) 的系统。它能理解用户目标,自主选择行动路径,并利用外部工具执行任务。简单来说,它是“能帮你做事的AI”,而不仅仅是“能和你聊天的AI”。比如你告诉它“帮我分析最新销售数据,并生成周报”,它不会仅仅生成报告模板,而会:1.查询数据库 → 2. 分析关键指标 → 3. 生成图表 → 4. 写出总结报告 → 5. 邮件发送

文章图片
#人工智能#oracle#数据库 +1
【必学收藏】多模态RAG技术解析:从原理到实现,一文掌握大模型新趋势

Retrieval Augmented Generation,检索增强生成。是一种结合了信息检索技术和大型语言模型提示功能的框架。它通过从数据源检索信息来辅助LLM生成答案,提高了模型在知识密集型任务中的准确性和可信度。

文章图片
#人工智能#深度学习#AI
【必学收藏】多模态RAG技术解析:从原理到实现,一文掌握大模型新趋势

Retrieval Augmented Generation,检索增强生成。是一种结合了信息检索技术和大型语言模型提示功能的框架。它通过从数据源检索信息来辅助LLM生成答案,提高了模型在知识密集型任务中的准确性和可信度。

文章图片
#人工智能#深度学习#AI
    共 585 条
  • 1
  • 2
  • 3
  • 59
  • 请选择