logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型(LLM)发展历程及模型相关信息汇总(2023-07-12更新)

以下用表格形式汇总了从BERT(2018-10-11)到Baichuan(203-06-15)共计58种语言大模型的相关信息:主要从模型名称,发布时间,模型参数,发布机构,github/官网,发表论文7个维度进行统计。

文章图片
#语言模型#人工智能#自然语言处理 +2
大模型迎来2025开年大作:deepseek-R1与deepseek-R1-Zero

DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。 注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview(轻量预览版)。

文章图片
#人工智能#语言模型
清华最新发布114页大型推理模型的强化学习综述

本文综述了强化学习在提升大型语言模型(LLMs)为大型推理模型(LRMs)能力中的最新进展与挑战,回顾了以 OpenAI o1 和 DeepSeek‑R1 为代表的里程碑,强调通过 train‑time RL 与 test‑time compute 可放大长链推理能力

文章图片
#人工智能#算法#语言模型 +1
深入openai的发展历程,发现惊人细节

ChatGPT 是历史上增长最快的消费软件应用程序。从它的卑微起步到成为科技领域的革命性力量,我们将追溯它的历程和里程碑。

文章图片
#人工智能#团队开发
首发!美团开源最强数字人 LongCat 1.5:性能狂飙15倍,8步闪电成片!

美团LongCat团队开源了新一代数字人视频生成模型LongCat-Video-Avatar 1.5,通过三大技术突破解决行业痛点:1)采用Whisper-large编码器提升语音理解能力,实现更自然的唇部动作;2)引入GRPO强化学习优化数字人微表情和肢体语言;3)构建高质量多模态数据集改善手部交互效果。该模型将生成步数压缩至8步,推理效率提升15倍,在唇形同步、长视频稳定性等方面超越部分商业模

文章图片
#人工智能#算法#经验分享 +1
谷歌 I/O 2026:从算法工程师视角看,这一届把“代理”玩得有点意思

谷歌I/O 2026聚焦AI代理化发展,Gemini 3.5系列和Omni模型在速度、多模态理解上实现实用升级。核心突破在于将Agentic AI深度整合至搜索、Workspace等产品,推出Gemini Spark个人代理和Universal Cart购物助手,同时完善Antigravity代理平台基建。硬件方面,Android XR智能眼镜探索边缘计算场景。开发者工具、内容可信度和系统级智能成

文章图片
#人工智能#算法#语言模型
Gemini 3.1 Flash Live + Google Translate 双重大更新!

iPhone用户终于能戴耳机实时翻译,实时对话再无“卡顿”与“机器人味”!正式亮相,同时的实时耳机翻译功能全面登陆iOS并扩展到更多国家!这两大更新深度融合,让AI语音交互和跨语言沟通彻底进入“自然流畅”时代。无论旅行、开会还是日常聊天,都能像母语一样顺滑。

文章图片
#人工智能#算法#经验分享 +1
Anthropic发布的Claude Managed Agents 到底是个啥?

Anthropic发布最新模型给你现成的“生产级AI代理托管工厂”。它把Claude当大脑,再配上预调优的代理重构(harness)和全托管的基础设施(沙箱、会话、工具执行),你不用自己写循环、管容器、愁态持久化,直接API调用就行。

文章图片
#microsoft#人工智能#算法
Codex 4月17日重磅更新:代码生成速度暴增10倍,到底“重”在哪?

4月17日,Codex核爆升级!AI代理首次后台操控Mac桌面,多智能体并行干活,程序员生产力直接起飞,彻底躺平!

文章图片
#人工智能#语言模型#算法 +1
每个 AI 工程师都应该了解的A2A、MCP和ACP

每个AI工程师都应该了解的 A2A、MCP 和 ACP,当今顶级人工智能协议如何帮助代理进行交流、思考和协作

文章图片
#人工智能#计算机视觉#python
    共 118 条
  • 1
  • 2
  • 3
  • 12
  • 请选择