logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

新一代大语言模型架构:测试时间训练层(Test-Time Training,TTT)

近年来,随着Transformer架构的出现,人工智能特别是自然语言处理领域取得了飞跃性的进展。然而,最新的大语言模型架构Test-Time Training(简称TTT)的出现,可能会在不久的将来超越Transformer和Mamba。本文将详细介绍这一全新架构的设计理念、技术细节、实际应用及其潜在影响。

文章图片
#语言模型#人工智能#自然语言处理
国产操作系统70年发展历程:从起步到突围之路

近年来,随着华为鸿蒙操作系统的发布,国产操作系统再次成为焦点。很多媒体对国产系统的发展寄予厚望。然而,这一领域其实有着极为波折的历史,从早期的尝试、探索到后来的挫折,再到当今自研技术的崛起,国产操作系统走过了数十年的崎岖道路。本文将回顾国产操作系统从20世纪50年代至今的发展历程,揭示其中的技术发展、历史挑战与前景展望。

文章图片
#操作系统#鸿蒙系统
英伟达B300/GB300芯片发布:AI加速性能怪兽,推理模型的未来

随着AI技术的飞速发展,对计算性能的需求日益增加。尤其是在推理模型和大规模深度学习任务中,GPU的性能和内存成为了制约计算速度和效率的瓶颈。英伟达(Nvidia)作为全球领先的AI加速芯片制造商,持续推动着硬件的创新。在最新发布的**B300**和**GB300**系列GPU中,英伟达不仅带来了显著的性能提升,还通过全新的技术架构与供应链策略重塑了市场格局。本篇文章将深入探讨这些新一代GPU的技术

文章图片
#人工智能#linux
在 Windows 下利用 `.pem` 文件配置 VS Code Remote-SSH 连接远程服务器

在日常开发中,使用VSCode的Remote-SSH插件可以方便地通过SSH连接远程服务器,实现本地开发与调试的无缝衔接。然而,在Windows系统下,如果使用`.pem`私钥文件,配置过程中可能会遇到权限或路径相关问题。本文将详细讲解如何在Windows下通过`.pem`文件配置VSCode连接远程服务器。

文章图片
#ssh#服务器#运维
在 VS Code 远程连接服务器时遇到 “Bad permissions“ 错误的解决方案

在使用 **VS Code** 通过 **Remote-SSH** 插件连接到远程服务器时,很多开发者会遇到连接失败的问题。常见错误包括认证失败、SSH 密钥问题、文件权限问题等。本篇文章将详细介绍如何解决因 `.ssh/config` 文件权限不正确导致的连接问题。

文章图片
#开发语言#人工智能#ssh +1
解决AutoDL远程服务器训练大模型的常见问题:CPU内存不足与 SSH 断开

在使用远程服务器(如 AutoDL)进行深度学习训练时,通常会遇到一些常见问题,比如由于数据加载导致的内存消耗过高,以及 SSH 连接中断后训练任务被迫停止。这篇文章将介绍我在这些问题上遇到的挑战,并分享相应的解决方案。

文章图片
#服务器#ssh#运维 +3
IMU姿态估计原理全解析:为什么Roll、Pitch能修正而Yaw漂移?

> 本文面向希望深入理解 IMU(惯性测量单元)姿态估计原理的工程师、机器人爱好者和无人车开发者。我们将从物理测量原理出发,讲清楚:>> * IMU 中加速度计与陀螺仪各自的作用> * 为什么要融合> * 为什么 yaw(偏航角)会漂移> * 工程中如何解决这个问题

#算法#机器人
Liquid AI与液态神经网络:超越Transformer的大模型架构探索

自2017年谷歌发表了开创性的论文《Attention Is All You Need》以来,基于Transformer架构的模型迅速成为深度学习领域的主流选择。然而,随着技术的发展,挑战Transformer主导地位的呼声也逐渐高涨。最近,由麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)孵化的初创公司Liquid AI提出了一种基于**液态神经网络(Liquid Neural N

文章图片
#人工智能#神经网络#transformer
苹果M4芯片:大模型本地运算的转折点

在人工智能和机器学习领域,大模型的兴起对硬件提出了前所未有的挑战。苹果公司最近推出的M4芯片,被视为其在这场竞赛中的“第一式”。本文将探讨M4芯片的特点,并与其他芯片进行比较。

文章图片
#人工智能
    共 90 条
  • 1
  • 2
  • 3
  • 9
  • 请选择