logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI绘画:动漫角色生成赛

AI绘画在动漫角色生成领域的应用现状生成对抗网络(GAN)、扩散模型(Diffusion Model)等核心技术的简介赛事目标:推动高质量、风格化动漫角色的算法创新。

#AI作画
2025年校招/社招【大模型(LLM)】面试“八股文”

预训练(Pre-training):在海量无标注文本上进行自回归(Autoregressive, AR, 如GPT) 或自编码(Autoencoding, AE, 如BERT) 学习。解决方案:Flash Attention(显存)、Ring Attention(处理极长序列,如百万token)、更好的位置编码(如YaRN)。估算一个7B模型在BF16下,序列长度为2048时的显存占用。优势:在极

文章图片
#面试#职场和发展
Java转大模型指南

学习LoRA、Adapter等参数高效微调方法,这些技术可以降低计算资源需求。了解模型量化、剪枝等优化技术。学习使用ONNX、TensorRT等工具进行模型部署,这对Java开发者原有的系统集成经验很有帮助。学习监督学习、无监督学习、神经网络等基础概念。掌握线性代数、概率论和微积分等数学知识,这些是理解大模型工作原理的基础。根据现有Java经验,可以考虑模型部署、系统集成等方向。在GitHub上展

#java#开发语言
2025最新最全大模型八股文整理

注:具体实现需结合最新论文和开源代码(如HuggingFace库),建议通过实践项目加深理解。技术演进迅速,需定期跟踪arXiv最新研究成果。想要八股文的话v搜【艾登学长】

文章图片
#人工智能
2025最新最全【大模型八股文】零基础入门到精通,看完这一篇就够了!

掌握大模型相关的“八股文”是通过技术面试的关键一环。下面我为你整理了一个从基础到进阶的学习顺序和知识框架,并附上了一些经典面试题目,希望能帮助你系统准备。建议你在理解上述知识的同时,多动手实践,比如复现一些经典算法、阅读框架源码、参与开源项目或构建自己的个人项目。“八股文”虽重要,但切忌死记硬背。面试官更看重的是你是否真正理解概念背后的。希望这份梳理对你的学习有所帮助。祝你学习顺利,面试成功!技术

#人工智能
大模型论文架构

大模型指参数量超过亿级的深度学习模型(如GPT-3、PaLM),基于Transformer架构,通过海量数据训练实现多任务泛化能力。

#人工智能
2025最新最全【大模型教程】零基础入门到精通,看完这一篇就够了!

大模型(Large Language Models, LLMs)指参数规模超过百亿、甚至千亿的深度学习模型,如GPT-3、PaLM等。其核心是基于Transformer架构,通过海量数据训练获得文本生成、推理等能力。使用任务指令(如“翻译以下句子”)和示例数据微调模型,提升其遵循指令的能力。常用数据集包括FLAN、Self-Instruct等。训练数据中的社会偏见可能导致模型输出歧视性内容,需通过

#人工智能
java.lang.ClassNotFoundException: org.springframework.web.servlet.DispatcherServlet IDEA解决方法

java.lang.ClassNotFoundException: org.springframework.web.servlet.DispatcherServletIDEA中出现该报错时,应该查找Project Structure——>Artifacts——>查看WEB-INF目录下的classes和lib是否都正确。自己是因为WEB-INF目录下没有lib导致报错。移除原来的ch1

到底了