
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
V3:适合企业级大规模NLP需求,追求效率与成本平衡。R1:推荐学术研究、复杂问题解决场景,需深度推理与结构化输出。R1-Zero:适用于探索RL技术边界或需自我优化能力的实验场景。

Test time Scaling Law、RL Scaling Law和预训练Scaling Law,三者形成循环迭代。

新人学习手机 App 开发,一开始总要选择一条学习路径。如果你熟悉 Java 语言,可以学习安卓开发;如果熟悉脚本语言(比如 Python 或 Ruby),可以学习 Swift 语言,进行 iOS 开发;如果像我一样,比较熟悉 Web 网页技术,那么 H5 开发是最容易上手的。这个系列教程的第一篇,已经介绍过了手机 App 的种类。所谓的 H5 页面,其实就是混合 App 的前端,外面...
本文目标:汇聚目前大语言模型预训练、微调、RM/RL、评测等全流程所需的常见数据集,方便大家使用,本文持续更新。文章较长,建议收藏后使用。

在学习完大语言模型中最热门的两个概念大语言模型落地的关键技术:RAG和大语言模型上下文窗口初探后,关于RAG和长文本(long-context)的优劣比较引起了广泛的讨论,本文整理了大语言模型RAG vs. 长文本争论的5种类观点。

本文目标:汇聚目前大语言模型预训练、微调、RM/RL、评测等全流程所需的常见数据集,方便大家使用,本文持续更新。文章较长,建议收藏后使用。

声明:以下区块链相关概念及定义来源于维京研究院&甲子智库《区块链行业词典》,不用做任何商业用途,欢迎知识共享。1、区块数据区块/ Block区块是在区块链网络上承载交易数据的数据包,是一种被标记上时间戳和之前一个区块的哈希值的数据结构,区块经过网络的共识机制验证并确认区块中的交易。父块/ Parent Block父块是指区块的前一个区块,区块链通过在区块头记...
在学习完大语言模型中最热门的两个概念大语言模型落地的关键技术:RAG和大语言模型上下文窗口初探后,关于RAG和长文本(long-context)的优劣比较引起了广泛的讨论,本文整理了大语言模型RAG vs. 长文本争论的5种类观点。

赛博周刊 (Cyber Weekly),每周发布,本周的主题是「2024 世界人工智能大会」,欢迎关注、点赞、收藏、评论。

赛博周刊 (Cyber Weekly),每周发布,欢迎关注、点赞、收藏、评论。









