logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型决赛,砰,枪响了!

2025年,大模型领域传来第一声枪响!1月15日,科大讯飞发布了国内首个基于全国产算力平台训练的深度推理大模型——讯飞星火X1,在中文数学能力达到国内第一,并落地教育、医疗等刚需场景;讯飞星火的底座能力也再次升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,作为国内智能翻译领域的佼佼者,科大讯飞还发布了业界首个具备端到端语音到语音同传能力的大模型——星火

文章图片
#人工智能#开源#音视频 +2
什么是大模型?一图全面了解大模型,附国内外知名大模型及240余家大模型清单!

AI大模型是“大数据+大算力+强算法”结合的产物,是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容,通常情况下有数百亿乃至数万亿个参数,可以在不同的领域和任务中表现出智能。

文章图片
#语言模型#人工智能#自然语言处理 +1
大模型决赛,砰,枪响了! (2)

2025年,大模型领域传来第一声枪响!1月15日,科大讯飞发布了国内首个基于全国产算力平台训练的深度推理大模型——讯飞星火X1,在中文数学能力达到国内第一,并落地教育、医疗等刚需场景;讯飞星火的底座能力也再次升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,作为国内智能翻译领域的佼佼者,科大讯飞还发布了业界首个具备端到端语音到语音同传能力的大模型——星火

文章图片
#人工智能#开源#音视频 +2
一文了解国内外知名大模型及240余家大模型清单!

在数字时代,数据已成为新的石油,而大数据模型则成为了驱动这一时代变革的关键引擎。那么,什么是大模型?简而言之,大模型是指利用海量数据,通过先进的算法和技术,训练得到的具有强大预测和决策能力的模型。这些模型在诸多领域都展现出了惊人的应用潜力,如自然语言处理、图像识别、金融风控、智能推荐等。AI大模型是“大数据+大算力+强算法”结合的产物,是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能

文章图片
#开源#语言模型#人工智能 +1
简单几步微调Llama 3大模型,小白轻松上手

这是面向小白用户的一个超级简单的微调大模型示例,通过这个例子将得到一个速度翻倍,并可以包含自己业务知识数据的微调后llama3模型,可用于本地部署构建私有化的AI智能体。very 的 nice首先请准备好google账号和网络环境,这个示例基于goolge colab的免费算力完成。使用浏览器打开上方链接将点击copy to Drive复制笔记到自己账号下的网盘,点击之后弹出新窗口我们就在这个弹出

文章图片
智能体5级分类:从规则到大语言模型

智能体被定义为能够感知环境、做出决策并采取行动的人工实体。受汽车工程师协会(SAE)自动驾驶六级分类的启发,智能体也根据其功能和能力被划分为以下层级:L0——无 AI,具备工具(有感知能力)和行动;L1——使用基于规则的 AI;L2——用基于模仿学习(IL)/强化学习(RL)的 AI 替代基于规则的 AI,增加推理和决策能力;L3——应用基于大型语言模型(LLM)的AI 替代基于 IL/RL 的

文章图片
#分类#语言模型#数据挖掘 +4
学习笔记:一文了解智算产业发展的N个趋势(含资料分享)

前言,最近一直在持续学习智算相关的资料,了解最新的技术&产品&方案,同时借助个人自媒体也有幸认识了智算相关领域的众多朋友,包括IDC服务商、项目集成方、算力运营方、算力相关产品方、各类资方、大模型公司、机房设施、液冷产业链、国产AI芯片、芯片互联、电力方案、设计院和培训机构等,大家探讨最多的就是从各自维度如何看待“智算产业的发展趋势”,这两天学习了中国电信的**《智算产业发展研究报告(2024)》

文章图片
#学习#人工智能#开源 +3
[NLP]如何训练自己的大型语言模型

大型语言模型,如OpenAI的GPT-4或Google的PaLM,已经席卷了人工智能领域。然而,大多数公司目前没有能力训练这些模型,并且完全依赖于只有少数几家大型科技公司提供技术支持。在Replit,我们投入了大量资源来建立从头开始训练自己的大型语言模型所需的基础设施。在本文中,我们将概述我们如何训练LLM(Large LanguageModels),从原始数据到部署到用户面向生产环境。

文章图片
#自然语言处理#语言模型#人工智能 +3
【2025版】大模型入门自学资源汇总,零基础入门到精通,收藏这篇就够了 (2)

接触各种AI工具到现在也快两年了,今年和同学陆续做了一些AI应用的科普宣讲,在这过程中收集了不少自学资源,特地挑出一部分整理成以下的内容。书籍大模型应用开发极简入门:基于GPT-4和ChatGPT首推今年年初出版的《大模型应用开发极简入门:基于GPT-4和ChatGPT》,小红书上也有人叫它“章鱼书”(实际上是刺蛇尾Ophiothrix spiculata)。这本书应该是目前综合下来最好的大模型应

文章图片
#人工智能#哈希算法#web安全
大模型到底能干啥,不能干啥?_大模型不能做到什么

举例:高精确度:中国的首都是哪里?北京。低精确度:请一句话赞美上海。上海,这座璀璨的东方之珠,以其独特的魅力、繁荣的经济和深厚的文化底蕴,展现了无与伦比的现代都市风采。特点:高精确度的结果一般是有正确参考答案的,像人的理性思考。低精确度的结果,一般没有正确回答,怎么回答都可以,像人的感性思考。

文章图片
#人工智能#AIGC#transformer +1
    共 334 条
  • 1
  • 2
  • 3
  • 34
  • 请选择