logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

小红书开源「InstantID」效果炸裂

ID Embedding:团队利用预训练的面部识别模型代替 CLIP 来提取语义人脸特征,并使用可训练的投影层,将这些特征映射到文本特征空间,形成 Face Embedding,具有丰富的语义信息,包括如面部特征、表情、年龄等,为后续的图像生成提供了坚实的基础。整个过程是自动化的,用户不需要进行任何额外的微调或训练,只需等待二十几秒,就能得到一个既符合文本描述又保留个人身份特征的定制图像。无论是古

文章图片
#人工智能#科技
Stable Diffusion 3 技术论文解读:开源能赢得文生图竞赛吗?

2023 年 6 月,福布斯发布的一则长新闻在网上发酵,30 多位 Stability AI 的前员工和投资人现身说法,细数 Emad Mostaque 的 9 大罪证,包括窃取 Stable Diffusion 成果,隐瞒融资困难,夸大公司收入,拖欠员工工资,学历和工作经历造假等等。MMDiT 为文本和图像模态分别使用了两套独立的权重,这相当于为每种模态创建了独立的变换器,但在注意力操作中将两种

文章图片
#人工智能
OpenAI开源超级对齐方法:用GPT-2,监督、微调GPT-4

研究人员在NLP等测试任务中进行了实验,结果显示,使用GPT-2作为监督来微调GPT-4模型,并在上述增强功能的帮助下,性能差距仅有20%左右,达到了GPT-3 和GPT-3.5之间的能力。在过去的研究中,“强监督”一直被认为是训练智能模型的最佳方法,通过为模型提供准确的标签来监督其学习过程,RLHF便是最典型的应用。惊奇发现,当使用弱模型生成的标签,对强预训练模型进行微调、指导时,强模型通常比弱

文章图片
#人工智能
中国电信开源星辰AI大模型

没想到啊,开源大模型家族里,居然挤进来一位来自央企,身份为运营商。具体是谁?。所谓“不鸣则已,一鸣惊人”:中国电信集团成立的中电信人工智能科技有限公司凭借全自研算法、精心打造的高质量数据集,发布其目前开源的版本在大模型知名榜单CSL上排名第五、GAOKAO排名第七、AGIEval排名第八。什么概念?和科技公司出品的专业选手们站在了同一阵营。现在,随着其代码和模型在Github、Gitee、Hugg

文章图片
#开源#人工智能
8天狂收6000+⭐️,可商用的开源Stream Diffusion

此外,流批式去噪方法的好处在于,每次调用U-Net就可以使多个图像同时推进一步,而U-Net的批量运算非常适合GPU并行计算,所以整体运算效率非常高。此外,该方法还起到平滑数据流的作用。稍微复杂一点的“一次负条件”,是在第一步使用U-Net计算一次负向量,然后重复使用这个向量近似后面的所有负向量。效率方面,实现了超过91 FPS的生成帧率,是当前最先进的AutoPipeline的近60倍,并极大减

文章图片
推荐一款适合程序猿使用的字体

程序猿们整天面对着14-2X的屏幕,如果看着自己敲击出优美代码,而字体很挫的时候,也会感觉不爽的,现把自己一直使用的字体推荐给大家,如果已经有这个字体的同学,请绕行。     此款字体名称为Source Code Pro,很高大上的字体,我是一直在ubuntu下编程使用此字体。     使用方法:     1、字体下载地址:https://github.com/adobe-fonts/

关于生成式人工智能在2024年的20条预言,我对每一条都表示不负责

围绕着大语言模型的开源与闭源,世界顶级的AI企业和科学家展开了一场激烈的大论战。Google强推Gemini进Android,中国几乎每一个智能手机厂商都在自己的手机里内置了自己的大模型/小模型。OpenAI与《纽约时报》的官司寻求和解,并为此付出数十亿美元的赔偿费用,但OpenAI的年度收入增加到了100亿美元。其中,欧洲和中国的“科学家创业”氛围更浓厚,硅谷则充斥着擅长搞产品应用的人和吹牛者。

文章图片
#人工智能#microsoft
马斯克将在本周,开源类ChatGPT产品Grok

结果显示,Grok-1 以 C (59%) 的成绩通过了考试,而 Claude-2取得了差不多的成绩 (55%),GPT-4 以 68% 的成绩获得了B,其推理能力还是挺不错的。根据xAI在官网公布的早期模型卡显示,首先开发团队先训练了一个330亿参数的原始大模型Grok-0,其性能相当于700亿参数的LLaMA 2,但仅使用其一半的训练资源。所以,马斯克在这个时间点选择开源Grok,估计和前几天

文章图片
#开源#人工智能
【推荐】一个国内免费体验的AI论文写作网站-「智元兔 AI」

智元兔AI是基于大语言模型的人工智能助手,并且具有出色的写作能力。它能够根据用户提供的题目或要求,自动生成高质量的论文和文章。

文章图片
#人工智能
OpenAI再次与Altman谈判;ChatGPT Voice正式上线

OpenAI与专业的配音演员合作,创建了5种合成语音,同时使用了自研开源语音识别系统 Whisper,将用户的语音转录成文本。11月22日,金融时报消息,OpenAI迫于超过700名员工联名信的压力,再次启动了与Sam Altman的谈判,希望他回归董事会。例如,让ChatGPT听一段指环王的文本故事,然后选择不同类型的人类语音就能完成转录,用户还可以下载这段语音。,如果OpenAI的员工选择离开

文章图片
#人工智能#oneapi
    共 18 条
  • 1
  • 2
  • 请选择