logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

deepseek如何作为鲶鱼搅动国内外所有AI大数据模型的,纯主观。

国内外包括豆包,文心一言,智谱,通义千问等主流大数据模型,均降价幅度在90%左右,而gpt4,4Turbo,3.5等模型,均有50%-75%不等的降价幅度(在其发布后一段时间内)包括Gemini各个模型以及其他的国外大数据模型的API都有不同程度的降价幅度,其降价范围处在ChatGPT与国内大数据模型普遍降价范围区间内,也不再阐述。Claude 2性能提升:在 Claude 1 的基础上,Clau

文章图片
#人工智能#大数据#自然语言处理 +2
多模态人工智能的现状,类型与未来发展的全面综合性分析论述报告(包括deepseek,Gemini等,共计20000字+)

在 MMLU 基准测试中,Phi-3-mini 的得分达到了 69.4%,Phi-3-small 达到了 75.3%,Phi-3-medium 达到了 78.2%。在 MMLU(大规模多任务语言理解)基准测试中,GPT-4o 的得分达到了 88.7%,超越了之前的 GPT-4 模型。在内部测试中,Sora 生成的视频在视觉质量、文本忠实度和时长方面,相比之前的文本生成视频模型,如 Runway G

文章图片
#人工智能#大数据#机器学习 +2
纯主观,对于通用Agent的个人看法和测评体验

目前的问题,目前的问题主要出现在他的要求太高了,他的api的要求输入输出的tokens要求太高了,而且记忆也是问题,这些东西都需要通过算法,还有算力的叠加,才能够解决,如果说你想要去做到这件事情,你不得不去面对这两个问题,而目前他们的做法是2选1,要么要求高的,准确度高的输出能力,然后牺牲他的用户数量,而另一种就是扩大用户数量,去减小它的输出能力,这都不是我们想要的,什么时候算力达标了,算法改进了

文章图片
#人工智能#大数据#算法
Gemini2.0pro?不,deepseekr1的平替。

他与ChatGPT o1模型和o3mini模型,都存在回答问题假大空的现象,但是,可以通过提示词去调节,他的编程能力是令我惊喜的,我假装我自己不知道如何去使用python,他完全可以较为独立的完成一款应用,当然肯定要我给予反馈,在大面上是没有问题的,包括bug的修复等等,肯定还是很粗略的,不是那么精细的,但是已经表现出了一种智能化的雏形,已经有种向deepseekr1靠拢的感觉,也就是我们所说的顿

文章图片
#人工智能#大数据#机器学习 +1
多模态人工智能的现状,类型与未来发展的全面综合性分析论述报告(包括deepseek,Gemini等,共计20000字+)

在 MMLU 基准测试中,Phi-3-mini 的得分达到了 69.4%,Phi-3-small 达到了 75.3%,Phi-3-medium 达到了 78.2%。在 MMLU(大规模多任务语言理解)基准测试中,GPT-4o 的得分达到了 88.7%,超越了之前的 GPT-4 模型。在内部测试中,Sora 生成的视频在视觉质量、文本忠实度和时长方面,相比之前的文本生成视频模型,如 Runway G

文章图片
#人工智能#大数据#机器学习 +2
人工智能大数据模型深度思考的具体原理阐述(以deepseekr1为例,较为专业,简化版看下一篇)

在人工智能领域,DeepSeekR1通过强化学习(RL)驱动推理链生成模拟这一机制:模型在生成答案前主动构建多步骤的“思维链”(ChainofThought,CoT),并通过规则奖励系统(如准确性奖励与格式奖励)实现自我验证。p值:在AIME 2024基准测试中,DeepSeekR1Zero的pass@1分数从15.6%提升至71.0%(p<0.001,卡方检验)。性能对比:在MATH500测试中

文章图片
#人工智能#大数据#自然语言处理 +2
多模态人工智能的现状,类型与未来发展的全面综合性分析论述报告(包括deepseek,Gemini等,共计20000字+)

在 MMLU 基准测试中,Phi-3-mini 的得分达到了 69.4%,Phi-3-small 达到了 75.3%,Phi-3-medium 达到了 78.2%。在 MMLU(大规模多任务语言理解)基准测试中,GPT-4o 的得分达到了 88.7%,超越了之前的 GPT-4 模型。在内部测试中,Sora 生成的视频在视觉质量、文本忠实度和时长方面,相比之前的文本生成视频模型,如 Runway G

文章图片
#人工智能#大数据#机器学习 +2
Gemini2.0pro?不,deepseekr1的平替。

他与ChatGPT o1模型和o3mini模型,都存在回答问题假大空的现象,但是,可以通过提示词去调节,他的编程能力是令我惊喜的,我假装我自己不知道如何去使用python,他完全可以较为独立的完成一款应用,当然肯定要我给予反馈,在大面上是没有问题的,包括bug的修复等等,肯定还是很粗略的,不是那么精细的,但是已经表现出了一种智能化的雏形,已经有种向deepseekr1靠拢的感觉,也就是我们所说的顿

文章图片
#人工智能#大数据#机器学习 +1
全面分析AGI的原理,现状,应用与未来展望(26000+)

(Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., ... & Petersen, S. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533.)然而,这些

文章图片
#人工智能#神经网络#深度学习 +1
人工智能大数据模型深度思考的具体原理阐述(以deepseekr1为例,较为专业,简化版看下一篇)

在人工智能领域,DeepSeekR1通过强化学习(RL)驱动推理链生成模拟这一机制:模型在生成答案前主动构建多步骤的“思维链”(ChainofThought,CoT),并通过规则奖励系统(如准确性奖励与格式奖励)实现自我验证。p值:在AIME 2024基准测试中,DeepSeekR1Zero的pass@1分数从15.6%提升至71.0%(p<0.001,卡方检验)。性能对比:在MATH500测试中

文章图片
#人工智能#大数据#自然语言处理 +2
    共 12 条
  • 1
  • 2
  • 请选择