
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
DeepSeek训练数据揭秘:高质量语料如何炼成?
DeepSeek训练数据揭秘:高质量语料如何炼成?

从零训练一个大模型:DeepSeek 的技术路线与实践
从零训练一个大模型:DeepSeek 的技术路线与实践

零基础教程:用DeepSeek-API实现智能对话机器人
零基础教程:用DeepSeek-API实现智能对话机器人

AGI时代来临?2030年AI将如何改变人类社会?
AGI时代来临?2030年AI将如何改变人类社会?

HarmonyOS 开发套件 介绍 ——上篇
HarmonyOS 开发套件 介绍 ——上篇

ChatGPT背后的Transformer架构全解析:从原理到实战
Transformer架构自2017年提出以来,已成为自然语言处理(NLP)领域的核心技术,其核心思想是通过自注意力机制(Self-Attention)和并行计算,突破传统循环神经网络(RNN)在处理长序列数据时的局限性。ChatGPT作为Transformer架构的典型应用,通过大规模预训练和微调,实现了自然语言生成、对话交互等复杂任务。本文将从Transformer架构的原理、核心模块、训练流

大模型「瘦身」指南:从LLaMA到MobileBERT的轻量化部署实战
大模型「瘦身」指南:从LLaMA到MobileBERT的轻量化部署实战

DeepSeek-V3 vs GPT-4:技术对比与性能评测
DeepSeek-V3 vs GPT-4:技术对比与性能评测

AI for Science:人工智能如何改变科研
AI for Science:人工智能如何改变科研

大模型「瘦身」指南:从LLaMA到MobileBERT的轻量化部署实战
大模型「瘦身」指南:从LLaMA到MobileBERT的轻量化部署实战








