logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型开发实战,使用 LLaMA Factory 微调与量化模型并部署至 Ollama

它支持从预训练到指令微调、强化学习、多模态训练等全流程操作,并提供灵活的配置选项和高效的资源管理能力,适合开发者快速定制化模型以适应特定应用场景。秩越大,引入的可训练参数越多,模型对新数据的适应能力越强,但也增加了计算和内存的需求,可能导致过拟合。秩越小,引入的可训练参数较少,减少了计算和内存的需求,但可能不足以充分适应新数据,影响模型性能。Supervised Fine-Tuning:监督微调是

智谱GLM-5.1深度评测:8小时连续工作,开源大模型进入“工程交付“新纪元

全球首个通过真实工程任务验证8小时持续工作能力的开源模型,在SWE-Bench Pro上超越GPT-5.4和Claude Opus 4.6登顶全球第一,重新定义AI从"回答问题"到"完成项目"的范式转变。有个AI,在真实工程任务中连续工作了8小时,完成了1200多步操作,从零搭建了一套完整的Linux桌面环境。但真实工程任务不一样:你可能需要先查资料,再写代码,发现报错后换思路,再试,再报错,再换

智谱GLM-5.1深度评测:8小时连续工作,开源大模型进入“工程交付“新纪元

全球首个通过真实工程任务验证8小时持续工作能力的开源模型,在SWE-Bench Pro上超越GPT-5.4和Claude Opus 4.6登顶全球第一,重新定义AI从"回答问题"到"完成项目"的范式转变。有个AI,在真实工程任务中连续工作了8小时,完成了1200多步操作,从零搭建了一套完整的Linux桌面环境。但真实工程任务不一样:你可能需要先查资料,再写代码,发现报错后换思路,再试,再报错,再换

基于 Qwen3-VL-Embedding-8B 实现文搜图语义内容检索的实战教程

阿里通义千问团队推出的 Qwen3-VL-Embedding-8B 模型,在 MMEB-V2 基准测试中达到了 80.1% 的总体准确率,超越所有开源和闭源模型(截至 2026 年 1 月)。Qwen3-VL-Embedding-8B 是通义千问家族的最新成员,基于强大的 Qwen3-VL 基础模型构建而成。与之配套的 Qwen3-VL-Reranker 采用单塔架构(Cross-encoder)

智谱GLM-5.1深度评测:8小时连续工作,开源大模型进入“工程交付“新纪元

全球首个通过真实工程任务验证8小时持续工作能力的开源模型,在SWE-Bench Pro上超越GPT-5.4和Claude Opus 4.6登顶全球第一,重新定义AI从"回答问题"到"完成项目"的范式转变。有个AI,在真实工程任务中连续工作了8小时,完成了1200多步操作,从零搭建了一套完整的Linux桌面环境。但真实工程任务不一样:你可能需要先查资料,再写代码,发现报错后换思路,再试,再报错,再换

智谱GLM-5.1深度评测:8小时连续工作,开源大模型进入“工程交付“新纪元

全球首个通过真实工程任务验证8小时持续工作能力的开源模型,在SWE-Bench Pro上超越GPT-5.4和Claude Opus 4.6登顶全球第一,重新定义AI从"回答问题"到"完成项目"的范式转变。有个AI,在真实工程任务中连续工作了8小时,完成了1200多步操作,从零搭建了一套完整的Linux桌面环境。但真实工程任务不一样:你可能需要先查资料,再写代码,发现报错后换思路,再试,再报错,再换

Chandra OCR 2开源了!官方测试基准上拿下了85.9分,直接碾压了GPT-4o的69.9

A:综合准确率Chandra OCR 2(85.9%)vs GPT-4o(69.9%),表格识别Chandra(88%)vs GPT-4o(70%),数学公式Chandra(80.3%)vs GPT-4o(74.5%)。它不仅能认字,还能理解文档结构——标题层级、多栏排版、嵌套表格、数学公式、手写批注、表单复选框,它都能识别出来,并且原样输出为带语义的Markdown、HTML或结构化JSON。更

智谱GLM-5.1深度评测:8小时连续工作,开源大模型进入“工程交付“新纪元

全球首个通过真实工程任务验证8小时持续工作能力的开源模型,在SWE-Bench Pro上超越GPT-5.4和Claude Opus 4.6登顶全球第一,重新定义AI从"回答问题"到"完成项目"的范式转变。有个AI,在真实工程任务中连续工作了8小时,完成了1200多步操作,从零搭建了一套完整的Linux桌面环境。但真实工程任务不一样:你可能需要先查资料,再写代码,发现报错后换思路,再试,再报错,再换

别再用切块 RAG 了!这个开源工具让 AI 真正「读懂」你所有文档

它不替代 LangChain 、 LlamaIndex 或者你的 LLM 提供商( GPT-4 、 Claude 3.5 都支持),而是在这些工具之上叠加了。传统的 RAG (检索增强生成)系统有个致命弱点——它把文档切成碎片,只靠向量相似度来"猜"答案。如果你的 RAG 系统正在遭遇"答非所问"的瓶颈,或者你需要 AI 输出具备可审计性, Semantica 值得认真评估。如果你正在搭建企业知识

#人工智能
2026年大模型API免费额度盘点:14个平台薅羊毛指南,看这篇就够了

Gemini 2.5 Flash:$0.15/百万Token(输入),$0.60/百万Token(输出)Claude Haiku 3.5:$0.80/百万Token(输入),$4/百万Token(输出)GPT-4o-mini:$0.15/百万Token(输入),$0.60/百万Token(输出)。GPT-4.5:$2.50/百万Token(输入),$10/百万Token(输出)GPT-4o:$2.

#人工智能
    共 423 条
  • 1
  • 2
  • 3
  • 43
  • 请选择