logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

看看KIMI怎么说-Qwen3的两种思考模式是什么?

例如,用户可以为不同的任务设置特定的推理预算,根据任务的复杂性和对答案准确性的要求,控制模型的思考程度。以编写代码为例,Qwen3 会先理解用户的需求和意图,分析代码的结构和逻辑,然后逐步生成代码,并在过程中进行自我检查和优化,确保代码的准确性和可读性。例如,回答一些常见的日常问答,如天气查询、简单的知识问答等,它能够在极短的时间内给出答案,提高交互的流畅性。例如在解决复杂数学问题时,它会先仔细审

文章图片
#人工智能#深度学习#机器学习 +1
第十三个问题=Fine-tuning有多少种方法?

是通过在预训练大模型(如GPT、BERT)基础上,使用领域数据继续训练,使其适应特定任务的技术。:仅需少量标注数据即可实现高性能(1%~10%从头训练数据量)阶段2:解冻最后3层Transformer(学习率1e-4)A[Fine-tuning方法] --> B[全参数方法]:将通用语言理解能力转化为专业领域能力(医疗、法律等)C1 --> C1c(AdaLoRA-自适应秩):缓解灾难性遗忘,适合

文章图片
#人工智能#大数据#深度学习 +1
看看Gemini 2.5 Pro怎么说-怎么看Deepseek开源DeepSeek-R1-0528

DeepSeek 开源 DeepSeek-R1-0528 是一个非常积极的信号,它不仅代表了该公司在AI大模型领域的技术实力,更重要的是它为全球开源AI社区注入了新的活力。DeepSeek (深度求索) 开源其最新的 DeepSeek-R1-0528 模型,在人工智能领域,尤其是在开源社区,无疑投下了一颗重磅炸弹。它不仅展示了DeepSeek自身的技术实力,也为全球AI的开源生态注入了新的活力,有

文章图片
#开源#人工智能#深度学习 +2
看看KIMI怎么说-国内还有那些做GPU的厂商?

产品广泛应用于电信、金融、互联网、教育、交通等重要行业或领域,2024 年前三季度,营业收入为 61.37 亿元,同比增长 55.64%。:目前团队规模超 1000 人,已完成多轮融资,累计金额超 20 亿元,估值超 140 亿元,2024 年 9 月已启动科创板上市辅导。:已完成多轮融资,累计超 30 亿元,估值超 100 亿元,2025 年 1 月完成科创板辅导备案,预计 2025 年四季度上

文章图片
#深度学习#机器学习#人工智能
看看Grok3怎么说-Dify与Coze特点对比

Dify 和 Coze 都是用于构建 AI 应用的平台,但它们在功能、易用性和适用场景上有显著差异。以下是它们的对比,帮助您根据需求选择适合的工具。Dify 适合初学者、初创企业或需要快速原型设计的用户,尤其是在小型 AI 项目中。Coze 则更适合经验丰富的团队和企业用户,特别是在需要构建大型聊天机器人或处理复杂 AI 任务时。根据的建议,建议用户根据项目规模和专业知识水平选择,必要时可通过小规

文章图片
#人工智能#深度学习#机器学习 +1
看看KIMI怎么说-小米开源MiMo-VL多模态大模型

小米公司于2025年5月30日正式宣布开源其多模态大模型MiMo-VL,并开放了和两个版本的模型以及支持50+评测任务的框架至GitHub。这一举措为开源社区注入了新的活力,也预示着多模态大模型领域竞争的进一步加剧。小米开源的MiMo-VL多模态大模型在多个领域展现了强大的性能和广泛的应用潜力。其创新的架构设计和训练策略使其在多模态推理任务中表现优异,为开发者和研究人员提供了一个强大的工具和实验平

文章图片
#人工智能#机器学习#深度学习 +2
第二十四个问题-模型为什么要量化?什么是NT4、INT8、FP8、FP16、FP32量化?

通用低精度格式,硬件广泛支持(如NVIDIA TensorRT),推理速度显著提升。:极低精度,需配合特殊技术(如QLoRA)使用,大幅压缩模型体积。:INT8/FP16广泛支持,FP8依赖新一代硬件(如H100)。:低精度计算在硬件(如GPU/TPU)上更快,内存带宽需求更低。:动态量化(实时校准) vs. 静态量化(离线校准)。:训练加速(配合混合精度,如AMP)、移动端推理。:8位浮点数(如

文章图片
#人工智能#语言模型#机器学习 +1
看看豆包怎么说-对Qwen3发布有什么看法?

Qwen3 的发布标志着国产大模型从 “可用” 向 “好用” 的质变,其混合推理架构与开源策略正在重塑行业生态。未来三年,随着国产 GPU 性能提升与政策支持,Qwen3 有望在金融、医疗、制造等领域实现深度渗透,成为企业级 AI 基础设施的核心选择。然而,要在全球竞争中突围,仍需在复杂推理、多模态融合、全球化适配等方向持续突破。

文章图片
#人工智能#机器学习#深度学习 +1
看看KIMI怎么说-Dify与Coze特点对比

由字节跳动推出,是一款面向非技术用户的“低代码 AI Bot 开发平台”,主打快速搭建对话机器人,适合个人开发者、中小团队、C 端产品需求者,如电商客服、短视频创作者等。:是一款开源的生成式 AI 应用开发平台,主打“LLMOps”理念,目标用户是需要深度定制、私有化部署的企业和开发者,适合技术团队、企业开发者、需处理复杂业务逻辑的 B 端用户。开源,支持本地部署,便于企业定制和数据安全管理。:支

文章图片
#人工智能#深度学习#机器学习 +1
    共 155 条
  • 1
  • 2
  • 3
  • 16
  • 请选择