logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

什么是大模型训练?大模型入门到精通 收藏这篇就够了

总结一下训练的核心要素: 大:指模型参数数量巨大(数十亿、数万亿),参数是模型内部学到的“旋钮”,调整它们可以改变模型的行为。尝试微调:找一个特定的任务(如情感分析、特定领域问答),用一个较小的开源模型(如 BERT-base)和自己的数据集,完成一次完整的微调 流程。) 精通 分布式训练、阅读论文、模型架构创新、开源贡献 李沐的《动手学深度学习》(进阶部分)、Lilian Weng 的博客、Hu

#服务器#腾讯云
部署大模型的API实战教程!

我们假设使用FastAPI和Transformers库,部署一个开源的大模型,例如LLaMA-2或Mistral。使用transformers库,我们可以方便地加载模型。考虑到内存和性能,我们使用半精度(fp16)并在GPU上运行。环境准备:安装必要的库,如transformers, torch, fastapi, uvicorn等。模型加载:使用transformers加载模型和分词器。创建Fa

2025国内8个常用AI大模型的适应性比较

模型名称 核心特点与优势 主要适用场景 DeepSeek-2-3-10 逻辑推理和数学能力强-3-10,代码生成优化-2-10,推理成本低-2-3。编程开发-2-3、学术研究-2-3、复杂逻辑任务-2。豆包大模型-2-3 多模态交互能力(文本、图像、语音)-2,全场景覆盖-2,响应速度快-2。通义千问 (Qwen)-3-4-5 企业级生态完善-3,与阿里云服务深度集成-4,多模态能力-3-5。文心

#人工智能
API调用大模型如此方便,为何企业还要私有化部署大模型?

企业选择私有化部署大模型而非仅依赖API调用,主要出于数据安全、合规性、成本控制、定制化需求、业务连续性等多方面考量。合规性与数据主权 金融、医疗、政务等领域受严格监管,要求数据处理符合地域性法规(如数据本地化存储)。成本控制 长期来看,高频调用下私有化部署可能比按使用量付费的API更经济,尤其当企业有持续大量需求时。知识产权保护 使用第三方API时,模型输入输出可能被服务商用于模型改进,涉及知识

#人工智能#网络#大数据
国内五家大厂AI大模型,哪家最终可以胜出?

这是一个关于AI技术的专业问题,可能需要对比分析这些模型的特点和应用场景。我打算从几个关键维度来组织回答:首先概述每个模型的核心特点和技术优势,然后比较它们的性能和应用领域,最后根据使用场景给出选择建议。根据我看到的搜索结果,16 提供了腾讯混元的详细信息,显示它专注于多模态生成能力,特别是在3D内容生成方面表现突出。我考虑用一个表格来直观对比这些模型的核心特性,包括主要技术特点、代表模型/版本、

#人工智能#网络
大模型 | 一文让你彻底了解算力到底是如何计算出来的-算力的计算方法(CPU和GPU)

公式: = 108 SM × (4 Tensor Core/SM) × (1.41×10^9 周期/秒) × (128 运算/周期/Tensor Core) = 108 × 4 × 1.41×10^9 × 128 ≈ 78 TFLOPS (FP16/BF16, 输入输出为FP32) 对于更激进的INT8精度,Tensor Core能力更强,A100的峰值算力可达 312 TOPS(注意这里单位是O

#服务器#腾讯云#网络
智能体搭建知识库为什么回答不准确?

用户可能是开发者或者技术负责人,正在尝试用RAG技术构建智能问答系统,但发现回答质量不稳定。用户可能更关心实操层面的解决方案,而不仅是理论原因。比如ta可能遇到的是知识更新不及时导致回答过时,也可能是PDF解析时丢失了表格信息。还有prompt设计的重要性,同样的检索结果,prompt不同输出质量可能天差地别。用户要的是解决方案,比如建议ta用HyDE方法优化query,或者用Cohere rer

用Deepseek+TCADP搭建了一个智能体好用到哭!

进入控制台:登录后,在顶部导航栏找到“产品”,然后在“AI”或“企业应用”分类下找到“腾讯云智能体”,点击进入控制台。你也可以直接访问这个链接(请以官网最新为准):第二步:创建你的智能体 新建智能体:在控制台页面,点击“新建智能体”或类似的按钮。新建知识库:点击“新建知识库”,为你不同的知识领域创建分类(例如“产品手册”、“内部规章”、“常见问题FAQ”等)。当你有新的产品文档或政策更新时,记得随

#网络#人工智能
DeepseekAPI反应太慢?一招教你白嫖反应迅速的API!

5.前往控制台开通服务,点开知识引擎原子能力,再打开APIKEY管理,创建密钥并查看复制。如果有用的话,记得关注煮波,有问题随时都可以私信问煮波。3.点开大模型广场,下拉找到API调用指引,点开。4.点开APIKEY管理,限时免费,早用早白嫖!2.点开产品,找到人工智能与机器学习,进入腾。API域名+模型名称:deepseek-r1。1.浏览器搜索腾讯云进入,注册登录腾讯云。6.前往chat bo

#人工智能#网络
谈谈目前大模型的缺点和应用思路

①幻觉问题:大模型的底层原理是基于概率,所以它有时候会一本正经胡说八道,比如我们问基于大模型的问答系统,“故宫博物院下周一开门吗?所以在很多需要非常精准服务的场景,仅仅依赖GPT这种”盲目自信“的生成式回答是很不严谨的,而且看起来很难消除——目前我们常见的解决方案是前置一个BERT和语料维护,或者使用RAG(检索增强生成,目前正在成为主流)或者预置大量prompt做优化(有公司这么在做)。目前最好

#网络#人工智能
    共 23 条
  • 1
  • 2
  • 3
  • 请选择