logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

豆包视觉理解模型价格低至“厘时代”,0.003元/千tokens震撼发布!

视觉是我们认识世界的第一个重要途径,在学会语言的之前,认识世界依靠的就是双眼,在AI世界,视觉理解模型的重要性也就不言而喻。随着豆包视觉理解大模型价格进入“厘时代”,相信更多的企业和个人开发者都会想开始尝试这类模型,先人一步实现智能生活~本次发布会字节公布了一大堆模型升级信息,从文生图、语音到3D生成等等,其中最值得一提的就是——豆包视觉理解大模型。该模型不仅技术上有了升级,其价格更是低至0.00

文章图片
#图像处理#人工智能
阿里最新开源全模态大模型——Qwen2.5-Omni-7B,7B就能搞定“看听说写”,AI越来越像人了

阿里最新开源的Qwen2.5-Omni大模型,以“看听说写”全模态实时交互能力,重新定义了AI的“类人化”边界。当AI无限逼近人类感官时,AI应用的场景,或许将被改变。

文章图片
Qwen2 - VL的微调与量化实操指南:玩转智能操作

Qwen2 - VL 作为Qwen - VL的升级力作,不仅能读懂各种图片,还能理解超20分钟长视频,还具强大视觉智能体能力。接下来,小编将为大家带来Qwen2 - VL的微调及量化教程。快跟着小编快速搭建吧~

文章图片
视觉-文本压缩框架——Glyph本地部署教程,以视觉压缩重塑长上下文处理范式

Glyph是一个通过视觉文本压缩缩放上下文长度的框架。Glyph 没有扩展基于标记的上下文窗口,而是将长文本序列渲染为图像并使用视觉语言模型 (VLM) 对其进行处理。这种设计将长上下文建模的挑战转化为多模态问题,在保留语义信息的同时大幅降低了计算和内存成本。(上)长上下文任务的两种范式的比较:直接将纯文本输入 LLM 的传统方法,以及提出的基于 VLM 的范式 Glyph,它将文本渲染为紧凑的图

文章图片
当AI变身苏格拉底,大学生福音真的来了!OpenAI推出「学习模式」,交互式提示设计重塑学习范式

ChatGPT学习模式上线:苏格拉底式AI导师,正在重塑大学生的学习方式。

文章图片
#人工智能
DeepSeek深夜升级!V3.1模型可处理13万字长文本

DeepSeek在深夜上线了新模型V3.1:128k上下文、API无缝切换。

文章图片
#人工智能
ChatGPT革命升级!o3-pro模型重磅发布,奥特曼亲述“温和奇点”时代来临

ChatGPT进化:o3-pro重塑AI生产力,奥特曼宣告“温和奇点”正悄然开启新纪元。

文章图片
#人工智能
360智脑开源优化排序模型——360Zhinao-1.8B-Reranking本地部署教程,提升检索质量,减少大模型“幻觉”现象

360Zhinao-1.8B-Reranking 模型以自主研发的 360Zhinao_1.8B_base 模型为基础,其中自主研发的单向生成模型 360Zhinao_1.8B_reranking 平均得分为 70.13,目前位居总体第一及开源模型第一,为生成模型承担判别性任务开辟了新的可能性。包含四个子任务,分别是判断不同领域用户问答的相似度,以 MAP(Mean-average-precisi

文章图片
#RAG#人工智能
盘点AI 在医疗领域的应用场景

基于企业微信,通过AI+人工服务模式,源泉患者管理大模型正在配合管理员,同时向患者提供用药指导、提醒、答疑等全病程的个性化管理与服务。AI的融入,能肉眼可见地提高医疗服务的效率和质量、应对医疗资源短缺的挑战,我们有理由相信,AI有可能成为解决人类医疗难题的一把神奇钥匙,让我们共同期待AI在医疗领域创造更多的奇迹吧!2024年,大家共同见证了AI大模型在医疗医药领域的精彩表现:从智能化诊疗到药物研发

文章图片
#人工智能#健康医疗#AI
阿里深夜开源Qwen3-Next,混合注意力机制与极致稀疏MoE实现90%训练成本降低

阿里通义团队开源Qwen3-Next模型,采用创新MoE架构实现训练成本暴降90%,长文本推理速度提升10倍,突破AI算力成本瓶颈。

文章图片
#人工智能
    共 281 条
  • 1
  • 2
  • 3
  • 29
  • 请选择