logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLMs 能否胜任「数据标注」?机遇与挑战并存

本文作者从业界最新研究入手,全面评估了 LLMs 在数据标注领域的应用前景。文章指出,在某些场景下使用 LLMs 确实可以加快标注流程、降低成本,但也需要注意 LLMs 存在一些局限性,如对提示词的高度敏感性、不能支持多种人类语言符号,以及难以模拟人类的内在推理逻辑等。因此,我们不能期望 LLMs 完全取代人工标注,特别是在涉及需要主观判断或敏感内容的领域。

文章图片
#人工智能#AI
基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战

部分输出示例:https://www.oxen.ai/ox/Rust/file/GRPO_82_2025-03-02_22-49-17_Qwen2.5-Coder-1.5B-Instruct/outputs/GRPO_82_2025-03-02_22-49-17_Qwen2.5-Coder-1.5B-Instruct/cargo_test_rewards.jsonl?需要观察模型在每个奖励维度(如

文章图片
#rust#DeepSeek
万字详解AI开发中的数据预处理(清洗)

在现实生活中,大多数数据都需要进行清洗和预处理,以便在使用数据时达到最佳效果。机器学习流程只能处理数字,因此需要找到一种方法将非数字特征转化为数字表示。本文还介绍了三种缺失值类型:完全缺失、随机缺失和非随机缺失,并教授如何使用Python来检测和处理缺失值。通过阅读本文,我相信你将了解什么是数据清洗,还能掌握数据清洗的步骤以及如何进行实操。以下是译文,Enjoy!

文章图片
#人工智能#机器学习#python
走进AI图像生成核心技术 - Diffusion

2022年,Diffusion model成为图像生成领域的重要发现,推动了AI绘画应用的爆发式发展。Diffusion模型相较于其他的图像生成模型,在所需数据更少的背景下,图像生成效果有明显提升。本期IDP Inspiration,我们将和大家一起走进Diffusion的发展史。

文章图片
#人工智能#深度学习#计算机视觉 +1
上下文工程实施过程中会遇到什么挑战?有哪些优化策略?

作者提出,上下文工程是一套系统级的架构方法,它强调动态地、有策略地为模型组合信息,包括系统指令、对话历史、用户记忆、检索结果和工具定义等,从而在有限的上下文窗口中实现最优性能。其次,上下文窗口(模型的工作记忆)是有限的。用户查询或任务会触发从长期记忆源(情景记忆、语义记忆、程序记忆)中检索信息,它不再是被动的传统 RAG,而是由一个“智能体”主动驱动的、更复杂的 Agentic RAG 组件。简而

文章图片
#人工智能#AI
微调语言模型前,需要考虑这三个关键方面

编者按:随着大语言模型(LLM)的迅速发展,越来越多团队希望针对特定领域进行模型微调。但是实践运用中总是存在一些困难,直接应用并不总是能达到理想效果。本文着重探讨了三个关键问题:利用强大模型(如ChatGPT)的输出结果来微调较弱模型是否有效?如何选择是采用低成本的上下文学习还是对模型进行微调?如何处理超过模型上下文限制的长文本,让模型理解并回答关于长文本的复杂问题?此篇文章探讨了构建特定垂直领域

文章图片
#语言模型#人工智能#自然语言处理
语言模型文本处理基石:Tokenizer简明概述

今天,我们推出的这篇文章有助于读者深入了解大语言模型的工作原理。作者指出,大语言模型的核心在于将文本转化为数字表征,这就需要介绍 tokenizer 的概念。通过 tokenizer ,文本被分词并映射为 token id,这为模型理解文本提供了坚实的基础。作者还比较了基于统计学的文本自动补全和大语言模型的不同之处,说明了上下文窗口大小的重要性。最后,作者建议读者在使用 OpenAI 等平台时观察

文章图片
#语言模型#人工智能#自然语言处理 +2
分享一些“氛围编程”的工程化技巧

关键在于采用有逻辑的文档拆分方式,保持文档的实时性与简洁度,帮助您和 AI 共同维持对上下文的清晰认知(对项目背景、进展和细节的掌握)和控制(对项目方向和内容的管理能力)。文章系统性地介绍了“氛围编程”(Vibe Coding)的核心组成与工作流程,强调了明确需求与设计先行的重要性,并详细阐述了如何通过提示词工程、上下文管理、测试验证和文档协作等方式,最大化 AI 编程助手的效能。AI 助手只能创

文章图片
#AI#人工智能
Q-learning 入门:以 Frozen Lake 游戏环境为例

我们今天为大家带来的这篇文章,作者指出可以通过设计并训练 Q-learning 算法来解决强化学习中的决策问题。作者首先以 Frozen Lake 游戏为例导入问题。然后详细介绍 Q-learning 的设计思路,包括构建 Q-table、定义 value 更新公式、设置 reward 机制、添加 epsilon-greedy 探索策略等方法。最后作者通过代码示例详细展示了如何从零开始实现 Q-l

文章图片
#人工智能#深度学习#游戏
AI Agents 能自己开发工具自己使用吗?一项智能体自迭代能力研究

通过机器学习工程实现的自我改进轨迹,是由更优的算法、更纯净的数据和更高效率的内存使用驱动的 —— 即训练阶段的自我改进(training-time self-improvement)。作者发现,尽管两个模型都能创建出功能完备的工具集(GPT-5 偏向构建 Unix 风格的命令行工具,而 Opus 4 更注重拟人化的任务执行助手),但在真正执行复杂编程任务时,它们却几乎不使用这些自建工具,而是选择基

文章图片
#人工智能#AI
    共 157 条
  • 1
  • 2
  • 3
  • 16
  • 请选择