logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM核心参数配置指南:基础篇

欢迎关注公zh: AI-Frontiers和大语言模型聊天的时候,你是不是也觉得,光会写提示词还不够?有时候模型答得乱七八糟,真不是你的问题。其实不管是直接用对话框,还是调API,有个小细节特别容易被忽略——配置参数。你可以把这些参数想象成模型身上的调节旋钮,拧对了地方,回答的质量一下子就上来了。反过来,要是完全不管,或者凭感觉乱拧,那结果可就真不好说了。假设将调用大模型比作烹饪美食,那么参数调优

文章图片
#人工智能
transformer学习资源汇总

欢迎关注公zh: AI-Frontiers。

文章图片
#人工智能#transformer
Context Engineering要过时?AI圈新风口「Harness Engineering」,OpenAI/Anthropic齐发力

Harness Engineering是指设计、构建和迭代一套完整的运行环境与制度体系,包含工具接口、沙箱环境、架构约束、自动化测试、反馈循环及监控仪表盘,旨在引导和约束AI智能体,使其能够自主、可靠地完成复杂长周期任务,而无需人类实时干预。Harness Engineering的核心公式可以表达为,揭示了Harness Engineering的本质:模型负责原始推理能力,而Harness负责除此

文章图片
#人工智能
Google 迎来「DeepSeek 时刻」:TurboQuant算法实现3bit无损、8×加速、6×压缩、零预处理

原文:欢迎关注公zh: AI-Frontiers3月24日,谷歌在官方博客中推出革命性的压缩算法TurboQuant,相关内容将分别在 ICLR 2026和AISTATS 2026国际顶会发表。一经公布,引发了技术圈纷纷热议。更夸张的是,3月25日美股一开盘,存储芯片板块就集体迎来 「黑色时刻」,遭遇重挫。TurboQuant算法通过几何视角的向量量化手段,从根本上解决自回归推理中的「内存墙」难题

文章图片
GLM技术复盘:21篇论文深度解读智谱模型家族

回顾智谱AI从2022年到2026年的发布轨迹,可以观察到技术演进的三个阶段:首先是基座对标期(2022-2024),通过GLM-130B和GLM-4系列证明了国产大模型在知识理解与双语对齐上的竞争力;其次是能力深化期(2025),通过引入「Thinking」模式和多模态专家系统,将大模型的能力推向复杂推理与视觉感知的极限;最后是智能体转型期(2026),以GLM-5系列为代表,将智能体所需的长期

文章图片
GraphRAG开源生态全景:6大主流开源项目,微软/蚂蚁/港大项目同台PK

应对TB级别以上数据,利用其水平扩展能力和高可用架构支撑底层图检索。

文章图片
#开源#microsoft
收藏!AI代理全家桶:MCP/Skills/Agent /OpenClaw,原理+操作指南一步到位

原文:欢迎关注公zh: AI-Frontiers2024年底以来,AI领域经历了一场从对话式交互向代理式执行的范式转变。LLM不仅能知识问答,逐渐演变为能感知环境、制定计划并利用外部工具执行复杂任务的智能代理。在这一演化进程中,模型上下文协议(Model Context Protocol, MCP)、Skills规范、多样化的Agent开发框架以及 OpenClaw这样的集成化平台,共同构建了一个

万字长文解读Qwen进化史:27篇论文深度复盘Qwen模型家族

原文:欢迎关注公zh: AI-Frontiers自2023年生成式人工智能迎来爆发以来,LLM技术的发展已从单纯的堆训练数据、堆参数量,转向了架构效率、模态融合以及长上下文推理能力的深水区。在这场全球性的技术角逐中,阿里巴巴通义实验室推出的 Qwen(通义千问)系列模型,凭借其极其密集且高质量的开源迭代节奏,构建了一个庞大生态系统,覆盖了从端侧微型模型到云端巨型旗舰、从纯文本处理到全模态实时交互。

文章图片
#人工智能
万字长文解读Qwen进化史:27篇论文深度复盘Qwen模型家族

原文:欢迎关注公zh: AI-Frontiers自2023年生成式人工智能迎来爆发以来,LLM技术的发展已从单纯的堆训练数据、堆参数量,转向了架构效率、模态融合以及长上下文推理能力的深水区。在这场全球性的技术角逐中,阿里巴巴通义实验室推出的 Qwen(通义千问)系列模型,凭借其极其密集且高质量的开源迭代节奏,构建了一个庞大生态系统,覆盖了从端侧微型模型到云端巨型旗舰、从纯文本处理到全模态实时交互。

文章图片
#人工智能
# 收藏!强化学习从入门到封神:5 本经典教材 + 8 大实战项目 + 7个免费视频,一站式搞定# 学习资源## 经典教材[**《大模型算法:强化学习、微调与对齐》**](https://

本篇教程大致介绍 Legged Gym 的结构,使用方法,并以一个二阶倒立摆为例来完成一次实际的强化学习训练。适合强化学习初学者复现。文档包含 ①强化学习基本概念 ②Legged Gym 环境安装 ③Legged Gym 代码结构介绍 ④二阶倒立摆训练项目代码解读。#强化学习 #智能体 #学习资源。

#学习
    共 25 条
  • 1
  • 2
  • 3
  • 请选择