logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

谷歌推出新优化器Lion:优化算法的符号发现

来自谷歌、 UCLA 的研究者提出了一种通过程序搜索发现深度神经网络训练的优化算法,来自论文《Symbolic Discovery of Optimization Algorithms》。通过数千TPU小时的算力搜索并结合人工干预,得到一个更省显存且速度更快的优化器 Lion(EvoLved Sign Momentum),其在图像分类、图文匹配、扩散模型、语言模型预训练和微调等诸多任务上做了充分的

文章图片
#深度学习#机器学习
中国教育界的OpenClaw来了!清华团队开源「龙虾」老师——OpenMAIC!

清华大学开源全球首个多智能体AI教学框架OpenMAIC,实现一键生成沉浸式课程。该平台支持上传文档或输入主题自动生成包含PPT、测验等完整课程内容,并配备AI教师和同学进行互动教学。OpenMAIC特别强调个性化学习体验,可应用于从专业课程到儿童科普等多种场景,支持多语言和语音交互。其核心目标是解决在线教育的三大痛点:因材施教、互动陪伴和教师减负。项目开源后迅速引发广泛关注,用户可通过简单操作直

文章图片
Clawdbot爆火,连带Mac mini成当下最热“理财产品”

整个周末,一个叫做 Clawdbot 的AI智能体突然爆火。被它顺带带火的,还有 Mac mini。

文章图片
#人工智能
AI日报:阿里千问最强模型来了;Kimi开源K2.5;DeepSeek开源OCR2;Clawdbot迫于压力更名Moltbot

近期国内AI领域迎来多项重要突破:阿里推出万亿参数推理模型Qwen3-Max-Thinking,性能媲美国际顶尖大模型;DeepSeek开源OCR 2,首创"因果流"视觉推理技术,文本识别准确率提升3.73%;月之暗面开源多模态模型Kimi K2.5,支持视觉输入和Agent集群协作;腾讯混元图像3.0开源,跻身全球最强开源图生图模型。同时,OpenAI发布科研协作平台Pris

文章图片
#人工智能
谷歌发布史上最大「机器人、视觉和语言“通才”」模型:PaLM-E 562B

2023年3月6日,Robotics at Google、柏林工业大学和 Google Research 团队提出了一个具身多模态语言模型 PaLM-E,通过 PaLM-540B 语言模型与 ViT-22B 视觉Transformer模型相结合,足足有5620亿参数,可以称之为「史上最大视觉语言模型(VLM)」,无需特殊训练就可执行各种任务。PaLM-E 不仅可以理解图像,还能理解、生成语言,而且

文章图片
#机器人#人工智能
正值AI大模型繁忙期:Mistral再开源8×22B大模型,OpenAI发布「视觉版」GPT-4 Turbo,谷歌重磅发布Gemini 1.5 Pro,Meta确认开源大模型LLaMA 3

根据科技外媒The Information4月8日发布的报道,作为对标GPT-4的大模型,LLaMA 3的大规模版本参数量可能超过1400亿,而最大的LLaMA 2版本的参数量为700亿。同一天,OpenAI发布了 GPT-4 Turbo with Vision,这是最新的 GPT-4 Turbo 模型,具有视觉功能,可处理用户上传的照片、绘图和其他图像。4月10日,Mixtral-8×7B-Mo

文章图片
#人工智能
数据预处理:离散特征编码方法

文章目录数据预处理:离散特征编码方法无监督方法:1.序号编码OrdinalEncoder2.独热编码OneHotEncoder3.二进制编码BinaryEncoder4.计数编码CountEncoder5.哈希编码HashingEncoder6.BaseNEncoder7.Sum Contrast8.Backward Difference Contrast9.Helmert Contrast10.

文章图片
#机器学习#人工智能#数据分析
全球最强端侧多模态模型!国产「面壁小钢炮」MiniCPM-Llama3-V 2.5 来了!

得益于 VisCPM 的跨语言泛化技术,在中英双语多模态能力的基础上,MiniCPM-Llama3-V 2.5 仅通过少量翻译的多模态数据的指令微调,高效泛化支持了德语、法语、西班牙语、意大利语、俄语等 30+ 种语言的多模态能力,几乎覆盖了所有一带一路的国家,意味着全球上百个国家的数十亿人口,都能与 MiniCPM-Llama3-V 2.5 丝滑交互。OCR 技术进一步打磨,复杂推理与多模态识别

文章图片
#人工智能
最新开源:开源科研神器 OpenScholar 来了!能检索4500万篇论文,科研效率提升10倍!

本质上,OpenScholar 是一个进行过检索增强(retrieval-augmented)的语言模型,外接一个包含4500万篇论文的数据库,性能可以优于专有系统,甚至媲美人类专家。为了方便自动化评估,研究团队还推出了全新的大规模基准 ScholarQABench,覆盖了CS、生物、物理等多个学科,用于评价模型在引用准确性、涵盖度和质量的等方面的表现。总体而言, OpenScholar 实现了S

文章图片
#人工智能
清华、北大团队推出 LLaVA-o1:首个自发性视觉 AI 模型

LLaVA-o1 拥有 110 亿个参数,基于 Llama-3.2-Vision-Instruct 模型开发,设计了总结(summary)、描述(caption)、推理(reasoning)和结论(conclusion)4 个推理阶段。LLaVA-o1(11B) 在六个具有挑战性的多模态基准测试中表现优异,超越了其他竞争者,如 Gemini-1.5-Pro、GPT-4o-mini 和 Llama-

文章图片
#人工智能
    共 104 条
  • 1
  • 2
  • 3
  • 11
  • 请选择