logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

全面对比DeepSeek-V3模型、R1模型和R1-Zero模型

V3:适合企业级大规模NLP需求,追求效率与成本平衡。R1:推荐学术研究、复杂问题解决场景,需深度推理与结构化输出。R1-Zero:适用于探索RL技术边界或需自我优化能力的实验场景。

文章图片
#人工智能#AI#GenAI
通俗理解Test time Scaling Law、RL Scaling Law和预训练Scaling Law

Test time Scaling Law、RL Scaling Law和预训练Scaling Law,三者形成循环迭代。

文章图片
#人工智能#深度学习#算法
H5 手机 App 开发入门:技术篇

新人学习手机 App 开发,一开始总要选择一条学习路径。如果你熟悉 Java 语言,可以学习安卓开发;如果熟悉脚本语言(比如 Python 或 Ruby),可以学习 Swift 语言,进行 iOS 开发;如果像我一样,比较熟悉 Web 网页技术,那么 H5 开发是最容易上手的。这个系列教程的第一篇,已经介绍过了手机 App 的种类。所谓的 H5 页面,其实就是混合 App 的前端,外面...

大语言模型开源数据集

本文目标:汇聚目前大语言模型预训练、微调、RM/RL、评测等全流程所需的常见数据集,方便大家使用,本文持续更新。文章较长,建议收藏后使用。

文章图片
#语言模型#人工智能#自然语言处理
大语言模型RAG vs. 长文本

​在学习完大语言模型中最热门的两个概念大语言模型落地的关键技术:RAG和大语言模型上下文窗口初探后,关于RAG和长文本(long-context)的优劣比较引起了广泛的讨论,本文整理了大语言模型RAG vs. 长文本争论的5种类观点。

文章图片
#语言模型#人工智能#算法
大语言模型开源数据集

本文目标:汇聚目前大语言模型预训练、微调、RM/RL、评测等全流程所需的常见数据集,方便大家使用,本文持续更新。文章较长,建议收藏后使用。

文章图片
#语言模型#人工智能#自然语言处理
【区块链专题】区块链基本技术

声明:以下区块链相关概念及定义来源于维京研究院&甲子智库《区块链行业词典》,不用做任何商业用途,欢迎知识共享。1、区块数据区块/ Block区块是在区块链网络上承载交易数据的数据包,是一种被标记上时间戳和之前一个区块的哈希值的数据结构,区块经过网络的共识机制验证并确认区块中的交易。父块/ Parent Block父块是指区块的前一个区块,区块链通过在区块头记...

#区块链#比特币#分布式 +1
大语言模型RAG vs. 长文本

​在学习完大语言模型中最热门的两个概念大语言模型落地的关键技术:RAG和大语言模型上下文窗口初探后,关于RAG和长文本(long-context)的优劣比较引起了广泛的讨论,本文整理了大语言模型RAG vs. 长文本争论的5种类观点。

文章图片
#语言模型#人工智能#算法
Cyber Weekly #14:WAIC 2024

赛博周刊 (Cyber Weekly),每周发布,本周的主题是「2024 世界人工智能大会」,欢迎关注、点赞、收藏、评论。

文章图片
#人工智能#AI#GenAI
Cyber Weekly #32

赛博周刊 (Cyber Weekly),每周发布,欢迎关注、点赞、收藏、评论。

文章图片
#人工智能#语言模型#GenAI +1
    共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择