logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI News | 20250630】每日AI进展

Ovis-U1采用创新的架构设计,通过视觉分词器、视觉嵌入表和大型语言模型三大核心组件,高效对齐视觉与文本嵌入,显著提升了模型在复杂场景下的表现。此外,Ovis-U1延续了Ovis系列的开源传统,代码、模型权重和训练数据均已公开,为全球开发者提供了探索多模态AI的便捷工具。OmniGen2采用了两条独立的解码路径,有效提升了多模态语言模型的表现。知乎近日发布了其AI搜索工具“知乎直答”的最新版本,

文章图片
#人工智能#github#python +2
【AI News | 20250322】每日AI进展

DeTikZify强大的地方在于它能理解图表的语义信息, 能识别图表中的不同组成部分及其含义,比如坐标轴、数据点等,也就是说如果你想修改图表中的某个部分,你只需修改相应的语义信息,它就能自动更新TikZ代码。一张照片几秒钟创建出一个3D数字人,这个数字人可以做各种动作,效果看起来逼真,衣服、头发、面部等细节保持的很好。隐私优先的 AI 助手和智能体构建开源工具,它能让我们在本地设备上使用开源模型进

文章图片
#人工智能#github#python +1
【AI News | 20250321】每日AI进展

钉钉在“AI创业N次方”大会上推出新生态政策“AI创新N次方计划”,免除佣金、保证金及算力费用,并提供销售、品牌、技术、投资支持,降低AI创业门槛。蚂蚁以医疗大模型为核心,构建“机构-医生-患者”三维体系,打通诊疗到健康管理闭环,探索安全可信AI应用。天猫还推出AI直播、营销、智能客服等工具,全面提升效率,并展示AI冰箱等产品及虚拟家居体验舱,引领AI购物新趋势。此前,其“可灵AI”已整合Deep

文章图片
#人工智能#python#语言模型 +2
【AI News | 20250610】每日AI进展

R1-0528以其媲美顶尖专有模型的性能和开源特性,结合OpenRouter的免费API服务,大幅降低了AI开发门槛,尤其对资源有限的开发者极具吸引力。Rowboat由Agent、Playground和Copilot三大核心模块组成,能帮助用户创建、管理并部署由多个智能体协作的智能助手,同时提供HTTP API和Python SDK,大幅简化了智能体开发流程,受到广泛关注。王兴认为,AI发展短期易

文章图片
#人工智能#github#AIGC +2
【AI News | 20250409】每日AI进展

该技术采用两阶段训练机制,结合元奖励模型过滤机制,使Gemma-2-27B改造的DeepSeek-GRM-27B在多领域测试中超越GPT-4o等更大模型,显著提升推理可扩展性,为AI在创意任务和动态环境中的应用开辟了新路径,标志着大模型奖励机制的重要突破。其核心特点包括多模型支持(如OpenAI及国内主流模型)、灵活的多格式文档知识库、基于知识图谱的深度问答能力,以及简易的API配置和可扩展的智能

文章图片
#人工智能#AIGC#python +2
【AI News | 20250311】每日AI进展

比如模拟一个学术圈的社交网络,它会根据学者们的个人资料,像研究方向、发表的论文等来模拟他们的行为,生成相应的社交网络图。AI大模型应用日益广泛,未来影响深远。框架中设计了多个智能体,把原始故事文本转换为模态特定的提示,通过“修订-审核”机制迭代优化提示,确保文本内容与不同模态的一致性,以及图像生成部分的角色一致性。R1-Omni是一款基于强化学习与可验证奖励的全模态大模型,利用视觉和音频信息来识别

文章图片
#人工智能#python#github +2
【AI News | 20250710】每日AI进展

xAI计划进一步扩展Grok4的多模态功能,包括图像生成和视频处理。这些模型的开放性和灵活性为开发者提供了在本地环境中安全优化和微调模型的能力,显著提升了医疗AI研发的效率和质量。微软开源了最新版本的Phi-4家族模型——Phi-4-mini-flash-reasoning,该版本在推理效率上实现了10倍的提升,平均延迟降低了2到3倍,特别适合教育和科研领域的应用。此外,谷歌还升级了‘圈选搜索’功

文章图片
#人工智能#python#语言模型 +2
【AI News | 20250630】每日AI进展

Ovis-U1采用创新的架构设计,通过视觉分词器、视觉嵌入表和大型语言模型三大核心组件,高效对齐视觉与文本嵌入,显著提升了模型在复杂场景下的表现。此外,Ovis-U1延续了Ovis系列的开源传统,代码、模型权重和训练数据均已公开,为全球开发者提供了探索多模态AI的便捷工具。OmniGen2采用了两条独立的解码路径,有效提升了多模态语言模型的表现。知乎近日发布了其AI搜索工具“知乎直答”的最新版本,

文章图片
#人工智能#github#python +2
【AI News | 20250722】每日AI进展

高通AI研究院近日发布了颠覆性的CSD-VAR技术,通过创新的内容-风格分解方法,显著提升了视觉自回归模型的生成能力与创意灵活性。本综述全面探讨了语境工程的定义、原理、技术、架构、评估方法及应用,并指出了其当前局限和未来发展方向,强调其在构建可靠AI系统中的基础性作用。该模型通过创新的记忆机制,有效存储和提取场景信息,突破传统方法的限制,提升场景生成的连贯性和一致性。这一模式整合了多项工具,实现了

文章图片
#人工智能#AIGC#语言模型 +2
【AI News | 20250320】每日AI进展

Arcade.dev获1200万美元种子轮融资,由Laude Ventures领投,旨在为AI代理提供安全认证与集成平台,解决AI与企业及消费应用交互的安全难题。OpenAI发布o1-pro推理模型,投入更多算力提升响应质量,API定价高达输入150美元/百万token,生成600美元/百万token,是普通o1的十倍,仅限消费超5美元的开发者使用。支持多种模型和工具,可定制工作流程。T1模型备受

文章图片
#人工智能#AIGC#python +2
    共 46 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择