logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

微软 GraphRAG:使用知识图谱提升 RAG 性能

技术厉害了,该技术通过结合 LLM 生成的知识图谱和图机器学习,显著提升了对私有数据集的理解和分析能力,特别是在处理复杂信息和提供全面答案方面展现出其优势。

文章图片
#开源#语言模型
大语言模型可视化:3D 交互式 GPT 工作原理

允许用户以 3D 交互式观察和理解一个 GPT 风格的大语言模型在进行推理时的工作原理,对学习了解 LLM 非常有帮助,也可用于教学演示。,作者还有一个正在开发的。

文章图片
#语言模型#人工智能
ConsisID:开源的角色一致性文生视频模型

是一个用于生成角色一致性视频的文生视频模型(IPT2V)。通过参考角色图片,该模型能够生成身份一致的视频。这个模型现已完全开源,包括数据集,并且提供了一个。

文章图片
#人工智能#图像处理
JoyCaption:开放且支持 NSFW 的视觉语言模型

是一个开放、免费且未经审查的视觉语言模型(VLM),其最大的特点是多样性和完全支持 NSFW 内容。Readme 的介绍很有意思。

文章图片
#语言模型#人工智能#自然语言处理
RouteLLM: 开源 LLM 路由框架

的一个 LLM 路由框架,它通过分析不同模型的性能和成本将任务分配给合适的模型,能够在保持高质量的同时显著降低成本。例如一些简单问题就调用 Llama2 来处理,对于有难度的问题才去调用 GPT-4o 来处理,可以有效的降低成本。是 LMSYS 基于其大模型竞技场(Chatbot Arena)数据。

文章图片
#人工智能
Exa:为 AI 设计的搜索引擎

是一个号称专门为 AI 设计的搜索引擎,使用 transformers 技术,不仅基于关键词,还能通过语义理解公司、新闻、论文、Twitter、博客、PDF、Github 代码、个人网站或自定义分类进行内容搜索。此外,Exa 获得了 1700 万美元的融资,目前已开放 API,如果你在做 AI 搜索引擎,不妨接入试试,当然,如果你是普通用户,也可以直接。,不过它与现有的 Perplexity 之类

文章图片
#人工智能#搜索引擎
Meta Motivo:开源人体动作生成模型

是一个开源的人体动作生成模型,能够生成符合自然物理规律的复杂人体动作,如奔跑、翻滚、跳跃、瑜伽等各种精通和运动姿势。,强烈推荐你们玩一下,可以用来调整世界的重力、风,角色的姿势、动作,或者编程动作。

文章图片
#人工智能#开源
阿里开源 OmniAvatar:音频驱动数字人模型

NVIDIA 推出的 Describe Anything Model (DAM)[3] 是一款多模态大语言模型,它能够为图像或视频中的特定区域生成详细描述,支持通过点击、框选、涂鸦或遮罩等多种交互方式指定目标区域。OmniAvatar[1] 是阿里开源的一款基于 Wan 2.1 的音频驱动数字人模型。从目前已有的开源数字人模型来看,OmniAvatar 的表现算是相当出色了。EasyEdit[2]

文章图片
#人工智能
微软开源 phi-4 模型:14B 参数,性能超越 GPT-4o

在各种基准测试中,phi-4 对比同参数量的模型表现优异,甚至在 GPQA 和 MATH 基准测试中超过了 GPT-4o。这个模型最初于去年 12 月 12 日发布,现在竟然直接开源了,并且基于 MIT 协议,可商用。是微软刚刚开源的最强小参数模型,其参数仅为 14B。

文章图片
#人工智能
Oasis:首款 AI 生成式游戏,开启无限探索

是首款可玩的 AI 生成式游戏,基于《我的世界》训练的实时互动世界模型。玩家可以通过键盘输入生成帧,进行移动、跳跃、破坏方块等操作,每次游戏都能构建和探索全新的地图。目前开发团队正在计划开源模型架构、权重和研究。官网可以直接玩,不过我试了好久只能渲染第一帧,不知道为啥,你们快试试看。

文章图片
#人工智能#游戏
    共 199 条
  • 1
  • 2
  • 3
  • 20
  • 请选择