logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

解释一下AI infra到底是干啥的

​AI Infra (Infrastructure)(AI基础设施)绝非单一硬件的简单堆砌,而是支撑 AI 训练与推理全流程的核心算力底座,涵盖 GPU/TPU/NPU 等算力芯片、高速存储系统、低延迟网络架构及智能调度软件,构成软硬深度协同的完整技术体系。

文章图片
#人工智能
大模型应用中一个 Token 占多少汉字?

​不同模型可能采用各自的切分方法,因此,一个 Token 所对应的汉字数量也会有所不同。如腾讯1token≈1.8个汉字,通义千问、千帆大模型等1token=1个汉字,对于英文文本来说,1个token通常对应3至4个字母, 不同的模型对相同的输入分词, 分词结果是不一样的。

文章图片
#人工智能#深度学习#自然语言处理
分词器(Tokenizer)详解

Tokenizer分词器,将一段文本分割成很多单词或者子单词,这些单词或子单词通过token词表被映射成一串id。简单点说就是将字符序列转化为数字序列,对应模型的输入。

文章图片
#深度学习#人工智能#nlp
大模型训练阶段数据要求(预训练+SFT)

目前大模型的训练主要会分为预训练和微调两个阶段,预训练又可以分为全量预训练和二次预训练。

文章图片
#深度学习#人工智能
AI领域的agent是什么意思

大语言模型的浪潮推动了 AI Agent 相关研究快速发展,AI Agent 是当前通往 AGI 的主要探索路线。大模型庞大的训练数据集中包含了大量人类行为数据,为模拟类 人的交互打下了坚实基础;另一方面,随着模型规模不断增大,大模型涌现出了上 下文学习能力、推理能力、思维链等类似人类思考方式的多种能力。将大模型作为 AI Agent 的核心大脑,就可以实现以往难以实现的将复杂问题拆解成可实现的子

文章图片
#人工智能
Kotlin IntelliJ IDEA环境搭建

Kotlin IntelliJ IDEA环境搭建IntelliJ IDEA 免费的社区版下载地址:https://www.jetbrains.com/idea/download/index.html下载安装后,我们就可以使用该工具来创建项目,创建过程需要选择 SDK, Kotlin 与 JDK 1.6+ 一起使用。在右侧的下...

解释一下AI infra到底是干啥的

​AI Infra (Infrastructure)(AI基础设施)绝非单一硬件的简单堆砌,而是支撑 AI 训练与推理全流程的核心算力底座,涵盖 GPU/TPU/NPU 等算力芯片、高速存储系统、低延迟网络架构及智能调度软件,构成软硬深度协同的完整技术体系。

文章图片
#人工智能
深度学习的Top10必会模型

自2006年深度学习概念被提出以来,20年快过去了,深度学习作为人工智能领域的一场革命,已经催生了许多具有影响力的算法或模型。那么,你所认为深度学习的最牛的模型有哪些呢?欢迎评论区留言讨论~以下是我心目中的深度学习top10模型,它们在创新性、应用价值和影响力方面都具有重要的地位。

文章图片
#深度学习#人工智能
Faiss cpu 版本安装

Faiss cpu 版本安装开发环境介绍centos 系统,64 位faiss 官方也是在64位系统测试的,因此不知道32位系统是否兼容。安装AnacondaAnaconda是 Python 的科学计算工具包。根据对 Python2 和 Python3 的支持,分为 Anaconda2 和 ...

“数字化”与“信息化”的区别和联系

“数字化”的涵义则更进一步,是通过信息技术在真实的物理世界之上,构建一个与现存物理世界密切相关互动的数字化虚拟世界(空间),在这个虚拟的数字空间里,人们可以在最小化接触物理世界的环境下,用一种全新的模式再现甚至重构原有物理世界的生产生活方式。“信息化”的核心在于将真实物理世界的业务、交易、方法、思想通过计算机和网络变成可以更快速、容量更大、传播范围更广、高度可复用的算法、程序和数据,并将这些信息资

#科技
    共 100 条
  • 1
  • 2
  • 3
  • 10
  • 请选择