cannonjinx 个人主页

@cannonjinx

cannonjinx

2026-01-31 23:48:32 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LLM代码评估：从人工判题到模型驱动的代码质量自动评分

LLM 代码评估在传统测试用例和静态分析的基础上，增加了语义层面的质量评估能力。三层评估架构——功能测试判断正确性、静态分析推断复杂度、LLM 评估可读性和鲁棒性——形成互补的质量画像。工程实现中需要控制 LLM 评估的延迟和成本，接受评分的有限精度，将 LLM 评估定位为"辅助参考"而非"绝对标准"。代码评估的终极目标不是给代码打分，而是帮助开发者理解代码的改进方向。补充落地建议：围绕“LLM代

#算法

AI 驱动的面试准备系统：从知识图谱到模拟面试的智能训练架构

AI 面试准备系统通过知识图谱结构化面试知识、薄弱点诊断精准定位短板、模拟面试提供低成本的练习环境，形成"诊断-训练-反馈"的闭环。知识图谱的先修关系追溯能力是系统精准性的关键，它避免了"头痛医头"的无效训练。落地路线建议：先构建核心知识图谱（覆盖算法、系统设计、数据库三大领域），节点数量控制在 100-200 个以保证可维护性；再接入 LLM 实现模拟面试功能，重点优化追问策略的递进性；最后通过

#算法

AI 辅助的算法复杂度分析：从人工推导到自动化推断的工程方案

AI 辅助算法复杂度分析构建了三层验证体系：静态分析层提取循环嵌套和递归模式，LLM 推理层识别算法模式并推导复杂度，性能实测层通过曲线拟合验证推断。三层结果聚合后输出，不一致时标记不确定性。静态分析对简单模式准确率约 80%，LLM 对常见算法准确率约 85%，性能实测最可靠但需要可执行代码。工程落地时，建议将 AI 推断作为辅助工具，关键算法仍需人工推导验证。

#算法

LLM 代码正确性验证方法论：从执行测试到形式化推理的分层验证

LLM 代码正确性验证需要从"跑通测试"走向五层分层验证：语法正确性（AST 解析）、执行正确性（测试用例）、边界正确性（极端输入）、复杂度正确性（静态分析）、逻辑正确性（人工审查）。前四层可以自动化，覆盖 80-90% 的常见错误；第五层需要人工介入，覆盖隐藏假设和逻辑缺陷。工程落地时，建议默认执行 L1-L4 自动化验证，对关键代码增加 L5 人工审查。边界用例生成和复杂度推断是当前自动化的薄

#算法

LLM 驱动的代码复杂度预测：从静态特征到运行时行为的建模

LLM 驱动的代码复杂度预测通过"静态特征提取 + LLM 语义推理"双引擎，补充了大 O 分析无法覆盖的常数因子、缓存友好性和分支预测等运行时特征。但预测精度有限，不能替代数学证明和基准测试。工程落地的正确姿势是：LLM 预测作为快速初筛和方向指引，数学推导验证渐近复杂度，基准测试确认实际性能。三者的关系是"LLM 猜方向 → 数学证边界 → 测测定性能"。

#算法

智能面试模拟系统：基于 LLM 的技术面试场景生成与评估

LLM 面试模拟系统的核心价值是"低成本的反复练习"。通过场景生成、追问模拟和评估反馈，帮助候选人适应面试节奏、提升表达清晰度、发现知识盲点。不能替代真人 mock interview，但可以作为高频练习的补充。落地建议：先实现算法面试模拟（题目明确、评估相对客观），验证系统可行性；然后扩展到系统设计和行为面试；最后加入语音交互，提升真实感。全程配合用户反馈，优化追问策略和评估准确性。

#算法

微调数据对齐搞不定？用 RAG 多路召回解决了检索相关性问题

多路召回 + 重排序：向量检索 + 关键词检索，提升召回率和精确率查询改写提升覆盖：补充同义词，扩大检索范围一致性自动检查：实时对比历史标注，确保数据质量低于阈值自动告警：防止标注偏差积累检索做好了，数据对齐的质量就稳了。

#算法

大模型长期记忆的工程化之痛：我是怎么被上下文窗口搞疯的

窗口限制用滑动窗口解决信息丢失用总结压缩检索用向量+关键词效率用分层架构没有银弹，但组合起来能有效缓解"失忆"问题。

#算法

LangGraph 多 Agent 协作的“安全漏洞“，差点把我们整崩

输入必须过滤工具调用必须校验Agent 之间做好隔离所有操作记录日志加上频率限制安全无小事，尤其多 Agent 系统，攻击面比单 Agent 大得多。

#算法

LangChain 框架大项目用起来有多痛苦？本文整理了一套工程化方案

import os@property})不要只用 BufferMemory：它会无限增长，最终导致 Token 超限自动压缩 + 摘要：定期总结历史对话，控制上下文大小持久化存储：进程重启后记忆不丢失分层记忆架构：短期记忆 + 短期摘要 + 长期记忆搞好了这些，LangChain 项目才能在真实场景稳定运行。

#算法

共 615 条

请选择