
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
23年3月份谷歌(包括柏林工大)发布了一个多模态语言大模型PaLM-E,发表论文即“PaLM-E: An Embodied Multimodal Language Model“。

phi-4 是一个拥有 140 亿参数的语言模型,其训练方法主要关注数据质量。与大多数语言模型不同,phi-4 在整个训练过程中策略性地加入合成数据,而大多数语言模型的预训练主要基于 Web 内容或代码等有机数据源。虽然 Phi 系列中先前的模型在很大程度上蒸馏教师模型(特别是 GPT-4)的功能,但 phi-4 在聚焦 STEM 的 QA 功能方面大大超越教师模型,这证明数据生成和后训练技术在蒸

介绍23年4月的综述论文“On Efficient Training of Large-Scale Deep Learning Models: A Literature Review“,京东、悉尼大学和中科大的合作。

25年7月来自浙大的论文“The Developments and Challenges towards Dexterous and Embodied Robotic Manipulation: A Survey”。实现类人灵巧的机器人操作一直是机器人领域的核心目标和关键挑战。人工智能(AI)的发展推动机器人操作的快速进步。本文概述机器人操作从机械编程到具身智能的演变历程,以及从简单夹爪到多指灵巧

25年7月来自浙大的论文“The Developments and Challenges towards Dexterous and Embodied Robotic Manipulation: A Survey”。实现类人灵巧的机器人操作一直是机器人领域的核心目标和关键挑战。人工智能(AI)的发展推动机器人操作的快速进步。本文概述机器人操作从机械编程到具身智能的演变历程,以及从简单夹爪到多指灵巧

23年10月CMU的论文“GPTutor: an open-source AI pair programming tool alternative to Copilot”。

23年12月来自美国西北大学、耶鲁大学和英国利物浦大学的论文“Empowering Autonomous Driving with Large Language Models: A Safety Perspective“。

24年2月来自CMU、普度大学、密西根大学等的综述论文“When Large Language Models Meet Vector Databases: A Survey”。

24年2月上海交大的论文“Comprehensive Cognitive LLM Agent for Smartphone GUI Automation”。

23年10月来自公司Meta Platforms(三个不同办公室)和两所大学:韩国KAIST和英国伦敦King’s College的论文“Large Language Models for Software Engineering: Survey and Open Problems“。








