logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

文心大模型3.5勇夺三个冠军领跑,中文完爆GPT-4!国际权威报告7项满分「全班第一」

其中包括了NLP、CV、跨模态等基础模型,对话、跨语言、搜索、信息抽取等任务大模型,生物计算领域大模型,行业大模型,以及支撑大模型应用的工具平台,形成了「基础-任务-行业」三级大模型技术体系。此外,百度文心大模型研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,使模型效果及场景适配能力进一步显著提升。现在,让它手写一段「统计字符串中出现

文章图片
#人工智能
万万没想到,诺贝尔化学奖也给了程序员

后来他又去读了神经科学的博士,并致力于 AI 研究,创办的 DeepMind 也被谷歌收购,并在 2016 年和 2017 年推出两代 AlphaGo ,击败了李世石和柯洁,从那时开始, AI 将取代人类的声音不绝于耳。可以说, 2.0 版本已经基本解决了单链蛋白质的预测问题,到 2021 年,基于 2.0 改版的 AlphaFold-Multimer 发布,也支持上了多链,准确度上也取得了突破,

文章图片
#人工智能
GPT-4耗尽全宇宙数据!OpenAI接连吃官司,竟因数据太缺了,UC伯克利教授发出警告

7月1日,谷歌更新了其隐私政策,现在的政策中明确谷歌有权收集任何公开可用的数据,并将其用于其人工智能模型的训练。证据就是,ChatGPT能够针对他们的书生成准确的摘要,这就足以说明这些书被当作数据来训练ChatGPT。紧接着,这周又有几位全职作者提出,OpenAI未经允许使用了自己的小说训练ChatGPT,构成侵权。2位起诉的作者认为,这些数据就是来自一些免费的网址,比如Z-Library、Sci

文章图片
#人工智能
ChatGPT性能暴降!OpenAI重磅回应!

对此,Sebastien Bubeck 解释称,相较于 GPT-4,ChatGPT 利用了更多基于人类反馈的强化学习来构建护栏,然而根据古德哈特定律,奖励模型并不是一个完美的代理,因此过度的 AI 对齐会阻碍模型对任务理解的真实程度。有一些较为流行的观点:ChatGPT 明显的性能下降可能来自“模型的缩放痛苦”,即,降低 GPT-4 的推理能力似乎是平衡响应速度的一种可能的解决方法,对于 Open

文章图片
#人工智能
国内首个类 ChatGPT 模型:复旦大学 MOSS 今日正式开源,RTX 3090 显卡可运行

4 月 21 日消息,复旦大学自然语言处理实验室开发的新版 MOSS 模型今日正式上线,成为国内首个插件增强的开源对话语言模型。目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。

文章图片
#人工智能#机器学习#深度学习
华为现场演示AI文生图时出现sleep代码,请问time.sleep(6)起到了什么作用?

网友发帖称,华为在发布会展示大模型文生图能力,在演示过程中,当第一次运行时按下 Ctrl-C 中断,显示对应的代码是 time.sleep(6)。说回代码,光看 main 函数,唯一能确认的是视频上的代码调了一个 rag.query,把返回结果写 io。但准确来说,视频是在演示 LLM 开发所需的非常重要的能力——RAG(检索增强生成)和 LLM 结合。小编懂一点代码,但不多,光看这段视频没搞懂

文章图片
#程序人生#华为
Github 屏蔽中国大陆IP?Github官方回应:纯属Bug,现已恢复

技术圈子里,这可不是小故障。若封禁成真,意味着华为鸿蒙、阿里飞天等顶尖项目的国际协作将瞬间停摆,国内AI训练所需的PyTorch、TensorFlow等框架更新也将受阻。2025年4月13日凌晨,中国开发者群体突然陷入集体焦虑——当未登录用户尝试访问GitHub时,页面赫然显示"403 Forbidden"的红色警告,提示"该IP地址受到访问限制"。中国开发者更应警醒:当美国商务部将14nm芯片、

文章图片
余承东官宣“纯血鸿蒙”将于10月8日公测,还预告了搭载鸿蒙系统的PC产品

不过,更让人在意的还是华为开发者官网展示的 UI 风格,从手机到平板再到 PC,你会发现不同系统之间的 UI 一致性非常高,这样的好处在于只要使用者之前接触过搭载鸿蒙OS的手机或平板电脑,那么就可以近乎无缝上手鸿蒙PC。虽然鸿蒙官方目前还没有正式上线PC版本的介绍,但一些页面似乎已透露了鸿蒙PC的布局和设计,从中不难看出其与目前主流的 Windows 系统有着非常明显的区别。可以看到,鸿蒙PC的设

文章图片
#harmonyos#华为
DeepSeek暨AI进化论十日谈——第七讲

老师进行深入分析,今晚20:00-21:30,围绕DeepSeek与软件开发智能化展开精彩讲解,欢迎扫码预约!它后续的影响有哪些?有了DeepSeek以后,管理软件是不是就可以有新的开发模式了呢?两天就震撼了整个AI界。在之后的两周里,AI界“满城尽带DeepSeek”。1月20日,国内的AI初创公司深度求索推出了大模型。

文章图片
#人工智能
雷军在线挖人,传年薪千万级!DeepSeek 关键骨干罗福莉已离职加入小米,或领军小米大模型团队;小米将在大模型上奋起直追!

而小米15整体的篇幅不足,更别提对大模型的介绍。一方面,这与小米向造车倾斜的转向有关,另外,小米这样做也在考量“产品优先”的原则。其中,大模型技术专家的要求包括,“长期从事自然语言处理、视觉、声学语音等相关领域的研究,对语言大模型或多模态大模型的原理有深刻的理解;在AI人才对整个产品举足轻重的今天,如何挖到人才,如何设置合理的架构让人才能发挥自己的一技之长,成为大厂们值得思考和研究的课题。据报道,

文章图片
#人工智能#程序人生
    共 260 条
  • 1
  • 2
  • 3
  • 26
  • 请选择