logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

豆包视觉大模型Doubao-vision-pro-32k——模型简评与使用

智匠MindCraft近期整合了全新的视觉大模型——Doubao-vision-pro-32k。该模型具备32K的上下文长度,支持多图识别功能,暂不支持视频识别。

文章图片
#人工智能#语言模型
豆包1.5系列登顶国内外模型-----解读与使用

这次发布了四个型号,doubao-1.5-pro-32k, doubao-1.5-pro-256k, doubao-1.5-lite-32k, doubao-1.5-vision-pro-32k,价格全部与上一个版本doubao模型一致,加量不加价。Doubao-1.5-lite 在轻量版语言模型中处于全球一流水平,在综合(MMLU_pro)、推理(BBH)、数学(MATH)、专业知识(GPQA)

文章图片
#人工智能#语言模型
通义千问更新数学大模型及视觉多模态

Qwen2-VL,这是通义千问最新的视觉大模型,在8月底发布各项指标对标目前最先进的视觉模型,在多项指标占有优势,并且可以识别视频。具体性能可能要评测,具有32K的上下文处理能力,成本是20元/百万tokens,比GLM4V-Plus贵一倍,但比国外对标的模型便宜。Qwen2-Math,这是通义千问专门为数学场景优化的模型,其数学能力指标甚至超越了GPT4o, Claude3.5 Sonnet,

文章图片
#人工智能#微信小程序
智匠AI文生图功能:将诗意转化为视觉艺术

结果:我们可以看到生成出来的图片基本要素都有抓到,作为画是不错的,但是好像跟诗里的意境和细节不太一样。那我们试一个高阶技巧。通过集成先进的AI模型如智谱的cogview3和openai的dalle3,智匠AI能够根据用户提供的文本生成相应的图像。:在瀑布的上方,可以画出天空,天空中的云彩可以画得较为轻盈,与瀑布的厚重形成对比。整幅画要传达出一种宏伟、壮观的自然景观,同时也要有一种超脱尘世的意境,让

文章图片
#人工智能
通义千问更新数学大模型及视觉多模态

Qwen2-VL,这是通义千问最新的视觉大模型,在8月底发布各项指标对标目前最先进的视觉模型,在多项指标占有优势,并且可以识别视频。具体性能可能要评测,具有32K的上下文处理能力,成本是20元/百万tokens,比GLM4V-Plus贵一倍,但比国外对标的模型便宜。Qwen2-Math,这是通义千问专门为数学场景优化的模型,其数学能力指标甚至超越了GPT4o, Claude3.5 Sonnet,

文章图片
#人工智能#微信小程序
智谱发布Z1系列推理模型

GLM-4-32B-0414(GLM-4-AIR-250414)指标评测。GLM-4-32B-0414 在工程代码、Artifacts 生成、函数调用、搜索问答及报告撰写等任务上均表现出色,部分 Benchmark 指标已接近甚至超越 GPT-4o、DeepSeek-V3-0324(671B)等更大模型的水平。这个模型推测应该是GLM-4-9B-0414 (GLM-4-FLASH-250414)训

文章图片
#人工智能#语言模型
Grok4模型简评与使用

模型:Grok4上下文:256K功能:文本,图片识别费用:输入24元/百万tokens输出120元/百万tokens(同Claude4Sonnet价格)

文章图片
#人工智能#AIGC#语言模型 +1
Qwen2.5新春三连发——Qwen2.5-1M, Qwen2.5-VL, Qwen2.5-Max

Qwen2.5新春模型三连发,分别发布了Qwen2.5-1M长上下文模型,Qwen2.5-VL视觉模型以及Qwen2.5-Max旗舰款模型。

文章图片
#人工智能#AIGC#语言模型
Cursor上使用MindCraft API

然后我们打开高通智匠(MindCraft AI)的开发者平台,进入到API KEY的栏目,我们可以看到这里能创建API KEY,还有API BASE URL。好了以后我们随便创建一个新文件,点击右上角打开Chat,然后选择“ask”模式,选择模型列表里的模型,就可以用了。我们看一下高通智匠的平台上支持哪些模型,这里有列出能够调用的大模型。首先我们打开Cursor,进入到设置,进入Models,这里

文章图片
#人工智能#语言模型
    共 27 条
  • 1
  • 2
  • 3
  • 请选择