logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GrammarGPT:基于监督微调的中文语法纠错开源LLMs探索

语法错误纠正(grammar Error Correction, GEC)旨在不改变句子的意思,自动纠正不符合语法的句子。在此之前研究汉语语法纠错(CGEC)主要是来自国外汉语学习者的错误,很明显这是不对的。因此,本次研究转向了母语人士的语法错误,这更加微妙和具有挑战性。以往对GEC的研究主要采用Seq2edit和Seq2seq两种方法,并在各种GEC上取得了令人印象深刻的性能基准。随着LLMs的

文章图片
#人工智能
本地部署|马斯克旗下xAI开源的Grok-1

今日AI资讯今天主要了解一下Grok-1模型规格、本地部署需要有哪些储备、本地部署的步骤以及部署过程中FAQ。

文章图片
#开源#人工智能
MemoRAG|下一代 RAG 框架

与传统的 RAG 不同,MemoRAG 利用其内存模型来实现对整个数据集的全局理解记忆,通过从记忆中生成查询特定线索来增强证据检索,还会从数据集的“记忆”中提取信息,从而生成更准确和上下文丰富的答案。进入MemoRAG,这是一个突破性的框架,它通过集成长期记忆功能将 RAG 推向新领域,实现更深入的上下文理解和更准确的信息检索。该模型生成线索或部分答案,指导相关信息的检索。:一个更强大、更具表现力

文章图片
#开源
阿里震撼发布Qwen2.5“全能套装”——打造史上最大规模开源盛宴

在 Qwen2 发布后的过去三个月里,许多开发者基于 Qwen2 语言模型构建了新的模型。Qwen2.5。

文章图片
#人工智能
阿里震撼发布Qwen2.5“全能套装”——打造史上最大规模开源盛宴

在 Qwen2 发布后的过去三个月里,许多开发者基于 Qwen2 语言模型构建了新的模型。Qwen2.5。

文章图片
#人工智能
Ubuntu20.04安装nvidia显卡驱动/CUDA/CUDNN

一、NVIDIA显卡驱动安装方式有哪些?二、安装NVIDIA三、安装CUDA四、安装CUDNN

文章图片
#linux
开源大模型训练及推理所需显卡成本必读:也看大模型参数与显卡大小的大致映射策略

随着各厂商相继发布大型模型,排行榜变化频繁,新旧交替,呈现出一片繁荣景象。有些技术爱好者也开始心痒难耐,萌生了构建一个庞大模型并进行训练的想法。每天都能看到各个厂家推出内测版本,这让人不禁思考:为何不在本地环境尝试一番呢?然而,当前手头仅有一块性能有限的老破小GPU显卡,这就引发了一个问题:如何在这样的条件下成功运行模型?

文章图片
#人工智能
到底了