logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek训练数据揭秘:高质量语料如何炼成?

DeepSeek训练数据揭秘:高质量语料如何炼成?

文章图片
#人工智能
从零训练一个大模型:DeepSeek 的技术路线与实践

从零训练一个大模型:DeepSeek 的技术路线与实践

文章图片
#人工智能
零基础教程:用DeepSeek-API实现智能对话机器人

零基础教程:用DeepSeek-API实现智能对话机器人

文章图片
#机器人#人工智能
AGI时代来临?2030年AI将如何改变人类社会?

AGI时代来临?2030年AI将如何改变人类社会?

文章图片
#人工智能
HarmonyOS 开发套件 介绍 ——上篇

HarmonyOS 开发套件 介绍 ——上篇

文章图片
#harmonyos#华为
ChatGPT背后的Transformer架构全解析:从原理到实战

Transformer架构自2017年提出以来,已成为自然语言处理(NLP)领域的核心技术,其核心思想是通过自注意力机制(Self-Attention)和并行计算,突破传统循环神经网络(RNN)在处理长序列数据时的局限性。ChatGPT作为Transformer架构的典型应用,通过大规模预训练和微调,实现了自然语言生成、对话交互等复杂任务。本文将从Transformer架构的原理、核心模块、训练流

文章图片
#transformer#架构
大模型「瘦身」指南:从LLaMA到MobileBERT的轻量化部署实战

大模型「瘦身」指南:从LLaMA到MobileBERT的轻量化部署实战

文章图片
#人工智能
DeepSeek-V3 vs GPT-4:技术对比与性能评测

DeepSeek-V3 vs GPT-4:技术对比与性能评测

文章图片
#人工智能
AI for Science:人工智能如何改变科研

AI for Science:人工智能如何改变科研

文章图片
#人工智能
大模型「瘦身」指南:从LLaMA到MobileBERT的轻量化部署实战

大模型「瘦身」指南:从LLaMA到MobileBERT的轻量化部署实战

文章图片
#人工智能
    共 28 条
  • 1
  • 2
  • 3
  • 请选择