logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习:PINN+LSTM轻松上大分,高区中稿!

PINN实在太好发论文了!在Nature、Science,和NeurIPS、ICLR等顶会上,都是霸榜的存在。PINN(物理信息神经网络)与LSTM(长短期记忆网络)的融合研究,已成为深度学习领域突破高区的创新路径。

文章图片
#深度学习#lstm#人工智能 +1
DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

Qwen3系列模型表现优异,其团队发现DeepSeek的GRPO存在训练不稳定问题,特别是在长序列和MoE模型中。Qwen团队提出新的GSPO算法,声称能解决GRPO的"病态"优化问题,该算法已应用于Qwen3系列模型并取得优异表现。

#人工智能#机器学习#开源软件
谷歌神秘模型Nano-Banana,实测:强到离谱,但有3大硬伤

神秘AI模型Nano-Banana引发热议,疑似谷歌研发但未获官方认证。该模型在图像生成和编辑上表现优异,能精准理解复杂提示词,实现多图元素融合,在商业场景中应用潜力大。不过存在生成细节瑕疵、体验不稳定等问题,且已出现多个假冒网站。实测显示其生成质量优于ChatGPT,尤其在人物细节和场景理解上更自然。网友还开发了与Veo3结合的创意玩法,如制作手办视频。目前该模型仅能通过LMArena平台随机体

#人工智能#百度
OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低

罕见,着实是太罕见。一觉醒来,AI圈的两大顶流——和,竟然破天荒地了。而且是互相短暂地授予对方特殊API权限,相互评估模型的安全性和对齐情况。要知道,在各个AI大模型玩家“厮杀”如此激烈的当下,如此顶流之间的合作方式,还是。然后我们再来看下这两份报告的大致亮点:在(Instruction Hierarchy)方面,Claude 4的表现略优于o3,但明显优于其他模型。在(Jailbreaking)

文章图片
#人工智能
Grok代码模型来了:限时免费用,速度超级快

马斯克旗下xAI本周推出全新代码模型GrokCodeFast1,速度较GPT-5快3倍且成本降低6倍。该专为AI编程任务优化的模型支持TypeScript、Python等主流语言,能自动调用开发工具完成代码任务。采用创新架构训练,在SWE-Bench测试中取得70.8%的高分,接近Claude4水平。现已免费开放一周试用,未来将升级支持多模态输入和扩展上下文功能。

#人工智能#架构
DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜

DeepSeek发布针对国产芯片的FP8量化策略UE8M0FP8,引发业界对大模型量化技术的关注。FP8作为低精度格式可平衡计算效率与模型精度,微软、Meta等巨头也在推进相关研究。与此同时,英伟达宣布更激进的FP4量化方案NVFP4,声称能在预训练阶段保持16位精度。该技术通过微块缩放、高精度编码等创新,在120亿参数模型上验证了可行性,训练速度较FP8提升7倍。这标志着AI训练进入超低精度新阶

文章图片
#人工智能
AI搜索MCP服务来了,Agent直接链接实时信息!刚刚,百度智能云打出了张“王牌”

百度智能云千帆4.0发布"Agent+AI搜索"解决方案,突破实时信息瓶颈。该平台通过开放百度AI搜索MCPServer组件,使Agent能获取实时动态数据并交叉验证结果,同时推出多模态RAG解析企业私域知识。平台集成150+精选模型,提供智能体编排框架和行业专精模型定制工具链,构建从数据治理到运行保障的全套企业级AI基础设施。

文章图片
#人工智能#AI#百度
中科大、智源等发布推理检索框架BGE-Reasoner,打破瓶颈,让RAG学会思考

中国科研团队推出BGE-Reasoner,在推理密集型信息检索领域取得重大突破。该方案由中科大、智源研究院等机构联合研发,通过创新的三阶段框架(查询改写-向量检索-强化排序)和基于大模型的数据合成技术,在权威BRIGHT基准测试中以45.2分刷新纪录,领先第二名3.6分。

文章图片
#搜索引擎#百度#人工智能
中科大、智源等发布推理检索框架BGE-Reasoner、打破瓶颈,让RAG学会思考

中国研究团队推出BGE-Reasoner,在推理密集型信息检索领域取得突破。该方案由中科大、智源研究院等机构联合研发,通过三阶段模块化框架(查询改写、向量检索、强化学习重排序)显著提升复杂推理任务中的检索性能。在权威BRIGHT基准测试中以45.2分刷新纪录,领先第二名3.6分。关键技术包括:利用大模型合成高质量训练数据解决数据稀缺问题;将强化学习应用于排序模型训练;提出的BGE-Reasoner

文章图片
#搜索引擎#百度#人工智能 +1
马斯克入局AI编程!xAI新模型限时免费用:256K上下文,主打一个速度快

马斯克旗下xAI推出智能编程模型GrokCodeFast1,主打快速响应和经济实惠,支持256K上下文窗口,在GitHub Copilot等多个平台限时7天免费使用。该模型性能媲美Claude Sonnet4和GPT-5,但价格仅为十分之一,具备多语言支持能力,在SWE-Bench测试中得分70.8%。实测显示其响应速度快、指令遵循优秀,适用于复杂自动化任务,每分钟可处理200万token,性价比

文章图片
    共 67 条
  • 1
  • 2
  • 3
  • 7
  • 请选择