想做大模型 / 智能体 AI 创业?先看这 3 个核心建议再行动
想做大模型 / 智能体 AI 创业?先看这 3 个核心建议再行动
今天这篇文章就把我和创投机构谈到的一些关于AI创业方向的一些关键思考进行整理,重点体现在如下三点,供大家参考。
1、 卷底层模型还是卷上层场景?
第一个点就是,对于AI创业团队,你不要太去内卷底层的技术,底层的大模型,而是更多的应该把它重心放在上层的AI智能体应用上面。
有些创业团队可能会感觉我的技术底层很牛,但是你要去做底层的大模型,包括你做大模型算法的一些优化,其实会花费你大量的成本和较长的一个时间周期。
在年后DeepSeek大火以后,可能会给大家一个错觉就是做底层大模型或算法优化并不是太难。但是实际这个事情仍然具备相当大的难度,即使是站在巨人的肩膀上,你也需要大量的时间的积累,成本和人员的投入。包括大家看到DeepSeek火了,实际对于幻方团队本身在这个方向就已经有相当长时间的算法和技术的积累。
而且,你如果将重心放在做底层模型或算法优化,你面对的都是巨头们的竞争。比如你在做通用模型,别人已经在做深度推理模型。你做出了R1版本,可能类似DeepSeek已经发布最新的R2版本。你一直走在追赶,实际很难超越。而且你会发现你大量前期的技术研究成果,到了后面往往一钱不值。
所以你不要去内卷底层的模型,你更多的应该去做上层的面向行业的AI智能体应用,但是这个就需要你对某一个行业某一个细分的业务领域有深刻的洞察。
也就是要做好AI智能体或AI应用也没有这么简单,这个难点根本不在智能体开发等技术方面,真正难的是你要有懂某个行业,懂细分业务领域的业务专家跟你一起来做这个AI应用。只有这样你才能够把业务专家很多原来历史的经验高度的浓缩到你的智能体应用里面去,这是我想说的第一个关键点。
2、数据训练-公开数据还是私有数据
第二个关键点就是AI创业在选择相关的产品或者是方向的时候,一定要选择你在互联网能够很容易获取到数据,去做你模型训练和调优的方向,而不是要太去找太多获取数据很困难的细分行业的私有数据方向。
类似于医疗行业,类似于政务行业,交通大数据这些行业。其实这些行业本身它对于人工智能的应用的需求也相当广,但是这个往往不是AI创业团队比较好的方向选择。
因为这些方向你要去获取到这些私有数据相当的困难,你获取不到私有数据,你就很难对模型进行很深刻的预训练或者是调优,反而是类似于我们经常说的,类似于上市公司它本身的财务报表分析,类似于我们说智能教育方面的智智能的一些课件的生成制作,这反而是一些好的方向。
因为你要获取这一些公有的数据相对来说容易很多,在我们方向选择完了以后,我们更要意识到,我们有时候又在谈大模型,有这有时候又在谈上层的智能体。大模型往往是底层的骨架,而智能体本身才是上层的血和肉,我需要的不是简单的底层骨架,而是我是需要有一个有血有肉的这么一个东西。你如果开发智能体只是简单套壳,那跟一个类似皮包骨头的人站在你面前有啥区别?
这也是我谈到的第二个关键点,即要做出好的AI智能体或面向垂直行业的AI应用,除了业务专家外,你还需要方便的能从互联网获取到数据,通过数据去训练你的应用,将训练出来的规则经验融入到智能体里面,作为智能体外挂的核心知识库。
3、 方向选择-究竟是蓝海好还是红海好?
第三个关键点就是我们很多时候AI创业,老是想去找一些新的方向新的蓝海,但是很多时候原来竞争比较激烈的红海,有可能反而是你可以去关注的方向。因为如果这个这个细分的方向是红海,至少说明这个细分的方向别人已经帮你探明道路了,它是有极大的市场空间和市场需求的。
那么在这些红海方向,你仍然可以把一件事情做到极致,类似于我原来经常讲过的一个例子。
比如说自然语言查询ChatBI这么一个方向,包括去年6月份我到华为松山湖去开相关的华为云的大会也在讲,华为也有类似的自然语言转SQL的这么一些产品,但是准确度可能只有90%。
还有类似于我们在生产制造领域,我们去做生产数据的质量分析和缺陷预测,现在也有大量采用了AI大模型的,但是准确度可能只有85%。
那么如果在这些细分的行业,细分的方向,你能够把准确度做到95%或者是99%,让他足够的可以去商用,那么这个产品仍然是具备相当大的意义和市场推广的价值。
所以究竟选择蓝海还是红海,一定要结合实际情况具体问题具体分析。如果自认为自己技术足够牛,反而选择已经经过市场验证的红海市场反而更加容易出成果,并快速推广。
好了,关于今天要谈的关于AI创业方面的三点建议就分享到这里。
那么,如何系统的去学习大模型LLM?
作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
为什么要学习大模型?
我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。
👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士,涵盖了多个领域,包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动,为开发者提供更多的学习和交流机会。
更多推荐
所有评论(0)