孤岛站岗个人主页

@baiyanggudao

孤岛站岗

2023-03-01 10:04:23 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【AI大模型入门】06：Claude——最“懂文章“的AI，长文本处理王者

📚长文档处理：业界第一梯队✍️写作质量：最接近人类水平💻代码能力：与GPT不相上下🛡️安全可靠：更少"一本正经地胡说"如果你经常处理长文本、做深度写作或代码工作，Claude 值得你花时间去尝试。

#人工智能

【AI大模型入门】07：Gemini——Google的AI反击战，搜索+AI完美融合

Gemini 是 Google 将搜索能力和AI能力深度融合的产物，它的最大优势不是"模型本身最强"，而是与Google生态的无缝整合。🔍实时搜索：回答最新信息能力最强📱生态整合：Gmail/Docs/Drive无缝协作📖超长上下文：100万token业界领先🎯多模态：文字/图片/视频/音频全能处理对 Google 重度用户来说，Gemini 可能是体验最"顺滑"的AI助手。

#人工智能 #计算机视觉 #深度学习

【AI大模型入门】E01：GitHub Copilot——让每个程序员都有AI副驾驶

📖：约9分钟🎯：程序员、学编程的同学、想了解AI如何辅助开发的人💡：Copilot是什么、背后的技术、能做什么、和Cursor等竞品的区别。

#人工智能 #github #copilot

【AI大模型入门】E02：Cursor——程序员说“用了就回不去“的AI编辑器

📖：约8分钟🎯：程序员、学编程的同学，以及想体验最新AI编程工具的人💡：Cursor是什么、为什么它比Copilot更"惊艳"、核心功能怎么用。

#人工智能 #编辑器

【AI大模型入门】D02：Grok——马斯克的AI，最“敢说话“的大模型

🐦X平台实时数据：独一无二的竞争优势💪Grok 3能力强劲：数学、代码、推理顶尖水平😈个性鲜明：比其他AI更"敢说话"🔓部分开源：Grok 1已完全开源🚀快速迭代：xAI研发速度极快如果你是X平台的重度用户，或者需要实时信息搜索与AI结合，Grok是不可错过的选择。

#人工智能

【词汇专栏】RLHF：ChatGPT 是怎么学会“听话“的？

RLHF（Reinforcement Learning from Human Feedback，人类反馈强化学习）是一种通过人类评分来训练 AI "按照人类偏好行事"的技术，让模型不只是预测下一个词，还能学会"什么样的回答更受人类认可"。RLHF 是让 AI 从"文字预测机器"变成"有礼貌的助手"的关键——它不改变模型的知识，而是改变模型的"价值观"，让它知道什么样的回答才算好。《微调 vs 预训

#人工智能

【AI大模型入门】08：通义千问——阿里的开源大模型，程序员和开发者必知

封闭模型（GPT/Claude）：你只能用API调用 → 必须付费 → 不知道内部怎么工作开源模型（通义千问/Llama）：代码和权重公开 → 可以免费下载 → 可以在自己服务器运行可以修改训练 → 可以商业使用 → 可以针对自己的业务微调🔓开源：可以免费下载、本地运行、商业使用💻代码能力强：专门的 Qwen-Coder 版本🧮数学推理好：Qwen-Math 竞赛级别表现🌐多语言支持：中文

#人工智能 #开源 #深度学习 +1

【AI大模型入门】A04：Whisper——AI终于能“听懂“人说话了

📖：约7分钟🎯：对语音识别感兴趣的人、想给视频自动加字幕的创作者、开发者💡：Whisper是什么、为什么它是语音识别的里程碑、能做什么、怎么用。

#人工智能 #xcode

【AI大模型入门】B13：Phi——微软“小钢炮“，用高质量数据颠覆参数神话

📖：约7分钟🎯：对边缘计算/手机AI感兴趣的人、开发者、想了解"小模型哲学"的人💡：Phi系列是什么、为什么小模型能强过大模型、适合什么场景。

#人工智能 #microsoft

【词汇专栏】PagedAttention：分页注意力——推理引擎的显存革命

借鉴OS分页：按需分配KV Cache显存利用率：40% → 90%（提升125%）吞吐量提升：3-4倍延迟降低：60-70%vLLM生产级实现：业界标配PagedAttention = 存储层优化FlashAttention = 计算层优化Speculative Decoding = 生成加速三者结合 = 极致推理性能ChunkKV：长上下文压缩ThinKV：推理模型优化R-KV：NVIDIA原

#python #开发语言

共 93 条

请选择