luomoyoushang 个人主页

@luomoyoushang

luomoyoushang

2023-07-16 16:20:21 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI绘画：动漫角色生成赛

AI绘画在动漫角色生成领域的应用现状生成对抗网络（GAN）、扩散模型（Diffusion Model）等核心技术的简介赛事目标：推动高质量、风格化动漫角色的算法创新。

#AI作画

2025年校招/社招【大模型(LLM)】面试“八股文”

预训练（Pre-training）：在海量无标注文本上进行自回归（Autoregressive, AR, 如GPT）或自编码（Autoencoding, AE, 如BERT）学习。解决方案：Flash Attention（显存）、Ring Attention（处理极长序列，如百万token）、更好的位置编码（如YaRN）。估算一个7B模型在BF16下，序列长度为2048时的显存占用。优势：在极

#面试 #职场和发展

Java转大模型指南

学习LoRA、Adapter等参数高效微调方法，这些技术可以降低计算资源需求。了解模型量化、剪枝等优化技术。学习使用ONNX、TensorRT等工具进行模型部署，这对Java开发者原有的系统集成经验很有帮助。学习监督学习、无监督学习、神经网络等基础概念。掌握线性代数、概率论和微积分等数学知识，这些是理解大模型工作原理的基础。根据现有Java经验，可以考虑模型部署、系统集成等方向。在GitHub上展

#java #开发语言

2025最新最全大模型八股文整理

注：具体实现需结合最新论文和开源代码（如HuggingFace库），建议通过实践项目加深理解。技术演进迅速，需定期跟踪arXiv最新研究成果。想要八股文的话v搜【艾登学长】

#人工智能

2025最新最全【大模型八股文】零基础入门到精通，看完这一篇就够了！

掌握大模型相关的“八股文”是通过技术面试的关键一环。下面我为你整理了一个从基础到进阶的学习顺序和知识框架，并附上了一些经典面试题目，希望能帮助你系统准备。建议你在理解上述知识的同时，多动手实践，比如复现一些经典算法、阅读框架源码、参与开源项目或构建自己的个人项目。“八股文”虽重要，但切忌死记硬背。面试官更看重的是你是否真正理解概念背后的。希望这份梳理对你的学习有所帮助。祝你学习顺利，面试成功！技术

#人工智能

大模型论文架构

大模型指参数量超过亿级的深度学习模型（如GPT-3、PaLM），基于Transformer架构，通过海量数据训练实现多任务泛化能力。

#人工智能

2025最新最全【大模型教程】零基础入门到精通，看完这一篇就够了！

大模型（Large Language Models, LLMs）指参数规模超过百亿、甚至千亿的深度学习模型，如GPT-3、PaLM等。其核心是基于Transformer架构，通过海量数据训练获得文本生成、推理等能力。使用任务指令（如“翻译以下句子”）和示例数据微调模型，提升其遵循指令的能力。常用数据集包括FLAN、Self-Instruct等。训练数据中的社会偏见可能导致模型输出歧视性内容，需通过

#人工智能

java.lang.ClassNotFoundException: org.springframework.web.servlet.DispatcherServlet IDEA解决方法

java.lang.ClassNotFoundException: org.springframework.web.servlet.DispatcherServletIDEA中出现该报错时，应该查找Project Structure——>Artifacts——>查看WEB-INF目录下的classes和lib是否都正确。自己是因为WEB-INF目录下没有lib导致报错。移除原来的ch1

到底了