logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

生成式AI原理技术详解(二)——高级神经网络

本文主要介绍了生成式AI的相关技术,特别是卷积神经网络(CNN)在图像识别领域的应用。本文为该系列第二篇,第一篇:生成式AI原理技术详解(一)——神经网络与深度学习引言如果看明白了上一篇文章对神经网络和深度学习的介绍,再来逐步深入了解AI相关的概念和原理应该就相对容易了。希望上一篇文章能给大家一点印象:AI并没有想象中复杂。AI能处理海量信息,但是它并没有人类难以理解、异常复杂的机制。因为只有机制

#人工智能#网络
多模态AI质检:身份核验场景实践

针对用户上传身份证时常见的图片问题,项目通过引入阿里云百炼平台的多模态模型,在OCR识别失败时进行智能检测与反馈,提供对客友好的提示文案,从而引导用户重新上传合格照片。上线后,相关指标表现出积极变化,OCR失败用户的再次失败率(OCR失败用户中再次识别仍失败的比例)有所下降,申请转化率有所提升。将“珠海”识别为“上海”。通过大模型提示词的增强优化,无需对每个场景进行大规模定制,用于多种类型的证件上

#人工智能
大模型训练实战经验总结

在当今AI技术飞速发展的背景下,定制化大模型的自主训练已成为满足特定行业需求、保障数据安全、提升模型应用效能的关键途径。本文将深度剖析这一过程的核心价值与实践智慧,从数据隐私保护、模型透明度增强,到数据预处理的精细操作,特别是数据配比在维持模型通用性与垂类能力平衡中的核心作用,为读者勾勒出一幅清晰的大模型训练全景图。背景▐定制化需求每个行业和应用场景都有其独特的需求,预训练的通用大模型可能并不..

#人工智能
大模型升级与设计之道:ChatGLM、LLAMA、Baichuan及LLM结构解析

本文通过深入剖析ChatGLM、LLAMA和Baichuan模型的升级路径,以及探讨大型语言模型结构选型,为大家提供了一个系统性的视角,梳理了大型预训练模型的关键要素。我们希望这些知识能够为大家在实际工程中构建更强大、灵活且高效的大型预训练模型提供有力的参考和指导。引言目前大语言模型在各个领域取得了显著的突破,从ChatGLM、LLAMA到Baichuan等,它们在处理各种自然语言任务时展现出了惊

前端开发想了解机器学习?用一台Mac就可以

可能有些同学学习机器学习的时候比较迷茫,不知道该怎么上手,看了很多经典书籍介绍的各种算法,但还是不知道怎么用它来解决问题,就算知道了,又发现需要准备环境、准备训练和部署的机器,啊,好麻烦...

#python#深度学习#人工智能 +2
Pipcook 1.0开源!前端开发者的机器学习工具箱

先来为大家介绍一下 Pipcook ,它是淘系技术部FX Team研发的一款面向前端开发者的机器学习工具箱。希望大家在阅读后,能够了解到 Pipcook 现在已经做了哪些,后面想要做...

#算法#大数据#编程语言 +2
9种常用的机器学习算法实现

简介根据机器学习的任务或应用情况的不同,我们通常把机器学习分为三大类:1、监督学习(Supervised Learning,SL),这类算法的工作原理是使用带标签的训练数据来学习输入变...

#算法#聚类#机器学习 +2
生成式AI原理技术详解(一)——神经网络与深度学习

本文主要介绍了生成式AI的最新发展,提到了GPT-5和AI软件工程师在行业中的影响,指出AI技术进步对国家竞争和个人职业发展的潜在影响。未来已来最近有两则新闻:sam altman自曝GPT-5细节,公开宣称GPT-5提升将非常大,任何小看它的公司都会被碾压。并发推暗示OpenAI今年的产品会改变人类历史。关于首个AI软件工程师的新闻,里面AI软件工程师表现已经相当出众,具备了整体规划、DevOp

#人工智能#深度学习#神经网络 +1
Tengine-Ingress 高性能高可用的云原生网关

统一接入作为阿里巴巴集团7层应用流量入口网关,其技术底座Tengine作为高性能的HTTP和反向代理web服务器,日常承载千万级QPS流量,为双11等各类大促活动保驾护航,对外提供永不停机的HTTP(S)接入服务。引言虽然Tengine以高性能和高可用著称,但统一接入的一些限制却一直为人诟病,最典型的就是应用域名新增和更新无法动态生效;新增证书和加签域名无法动态生效;用户侧HTTP(S)流量可配置

#云原生
基于LLM大模型Agent的适用范围和困境

本文提到大模型通常的工作方式,即通过提示词进行问答,并指出了两个主要问题:历史对话信息的管理和令牌数量的限制。文章讨论了知识库问答和个人助手两个应用场景,并分析了各自面临的困境,如知识库无法有效处理多模态信息和大型文档,个人助手则受限于工具参数的复杂性和令牌长度。文章还提到了微调(FINE-TUNING)作为改善模型性能的方法,以及在不同领域的应用潜力。最后,分享了对微调成为标准操作流程的预期,以

    共 120 条
  • 1
  • 2
  • 3
  • 12
  • 请选择