logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI预测未来翻车实录!复旦等高校推出FutureOmni基准,大模型准确率仅64.8%!程序员必看如何突破未卜先知瓶颈

复旦大学等机构联合推出首个全模态未来预测评测基准FutureOmni,包含919个视频和1034个问答对,评估13个全模态模型显示最佳准确率仅64.8%。研究提出OFF训练策略显著提升模型预测能力,填补了多模态大模型在预测未来能力方面的评测空白,为AI"未卜先知"提供新方向。

文章图片
#人工智能#gitlab#运维 +1
震惊!特斯拉9个月迭代AI芯片,混合精度桥接器技术让8位硬件跑出32位精度!程序员必学!

特斯拉推出AI5芯片,性能对标英伟达Hopper,成本仅为十分之一,能效比高出3倍。通过混合精度桥接器技术,在8位硬件上实现32位精度计算,解决自动驾驶物体恒存性问题。特斯拉采用每9个月一更的快速迭代策略,统一芯片架构,并规划了AI6至AI9系列芯片,旨在摆脱英伟达依赖,在AI领域建立技术优势。

文章图片
#人工智能#音视频#javascript
震惊!大模型也能“即插即用“?神经网络可重编程性让AI开发效率飙升10倍!小白程序员必学黑科技

本文提出"神经网络可重编程性"统一框架,整合模型重编程、Prompt工程等参数高效适配方法。该范式保持模型参数冻结,仅通过输入变换和输出对齐使预训练模型适应不同任务,比传统微调参数效率高2-3个数量级。文章从四个维度系统分类现有方法,为理解大模型适配提供统一理论视角,让开发者不修改参数也能让AI模型"秒变"多面手。

文章图片
#人工智能#神经网络#科技 +2
震惊!99%的AI智能体开发者都错了:5个颠覆认知,让你从“提示词奴隶“变身“架构大师“

文章揭示了构建强大AI智能体的5个颠覆性认知:1)上下文是"四层蛋糕"结构而非扁平字符串;2)提示词应"编译"而非手写;3)安全是核心协议而非插件;4)智能体"检索"而非"阅读"代码库;5)智能体的"大脑"与"身体"需解耦。真正的竞争力来自软件工程架构而非提示词,开发者需从"提示词工匠"转变为"智能体系统架构师"。

文章图片
#人工智能#架构#大数据 +2
国产大模型第一梯队!

本文详细解析了国产大模型第一梯队的八大玩家:深度求索DeepSeek、阿里通义千问、字节豆包、腾讯混元、百度文心、智谱AI、MiniMax和月之暗面Kimi。各模型在技术路线、开源策略、生态整合和API调用等方面各具特色,为开发者提供了丰富的选择,从数理推理到超长上下文,满足不同编程需求。

#人工智能#科技#重构 +2
程序员福音!GitLab推出AI代理平台,从写代码到安全检查,AI陪你走完开发全流程!

GitLab 18.8发布GitLab Duo Agent Platform并达到全面可用状态,帮助组织在整个软件开发流程中编排AI代理。该平台整合代理式聊天、任务导向代理、工作流自动化及企业级管控能力,提供集中AI目录和内置基础代理(Planner、Security Analyst等)。Planner Agent可管理工作项优先级,Security Analyst Agent处理漏洞管理,并新增

#gitlab#人工智能#运维 +2
为什么同样的AI,别人能写出神仙代码?揭秘大模型高手的5个心法,让你AI编程直接起飞!

文章揭秘了高效使用大语言模型的五个核心心法:从"提问者"转变为"指令官",使用"五维框架"构建清晰指令,掌握反向提问和专家模拟两种高级技巧,打造个性化AI助手,以及坚守"人在回路"的最终决策权。这些方法能帮助用户将AI从被动的"问答机"转变为高效的"任务执行器",释放AI生产力,同时保留人类在创造性工作中的最终控制权。

文章图片
#人工智能#游戏#架构 +1
为什么同样的AI,别人能写出神仙代码?揭秘大模型高手的5个心法,让你AI编程直接起飞!

文章揭秘了高效使用大语言模型的五个核心心法:从"提问者"转变为"指令官",使用"五维框架"构建清晰指令,掌握反向提问和专家模拟两种高级技巧,打造个性化AI助手,以及坚守"人在回路"的最终决策权。这些方法能帮助用户将AI从被动的"问答机"转变为高效的"任务执行器",释放AI生产力,同时保留人类在创造性工作中的最终控制权。

文章图片
#人工智能#游戏#架构 +1
爆肝整理!大模型开发三大支柱:Pipeline、算法与Infra全解析,附最新论文对比!

文章详解了大模型开发的三大支柱:Pipeline(预训练、微调和评估)、算法核心(数据预处理、模型结构和优化器)以及底层架构(训练、推理和强化学习基础设施)。这三者分别指明方向、决定上限和决定落地成本与速度,构成了从数据流到数学原理再到工程实现的完整闭环。

文章图片
#算法#人工智能#java +1
微调 DeepSeek-R1 进行股票交易及法律咨询应用(附代码)

在大模型应用当中最直接的方式就是用当前效果最好的模型, 但如果涉及到一些非常窄的决策领域, 例如股票交易, 或者法律咨询。。。那么微调也是一个比较好的方式, 特别是自己已经有验证过的高概率胜出(或者自认为高概率胜出)的股票逻辑。那我们自己可以构建对应的语料来微调deepseek, 以便他能够按照我们的逻辑来进行决策。股票交易我一直有一个很简单的交易逻辑, 测算了一下胜率大概是75%左右。我自己也微

文章图片
#python#人工智能#开发语言 +2
    共 1764 条
  • 1
  • 2
  • 3
  • 177
  • 请选择