
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
AI模型现在能够独立识别复杂软件中的高危漏洞。正如我们最近的记录,Claude在已经过充分测试的开源软件中发现了500多个零日漏洞(即软件维护者未知的安全缺陷)。本文将分享我们与Mozilla研究人员合作的具体细节:在这次合作中,Claude Opus 4.6在两周内发现了22个漏洞。其中,Mozilla确认了14个为高危漏洞——这占了2025年已修复的所有Firefox高危漏洞的近五分之一。换言

摘要:Skill-creator新增评估功能,帮助非工程师用户测试技能有效性。通过评估(evals)和基准测试(benchmark)两大核心功能,可检测技能退化、验证模型进展,并优化触发机制。系统支持多智能体并行评估,提供A/B测试对比,自动生成改进建议。该工具现已在Claude.ai、Cowork和Claude Code中可用,使技能开发更严谨可靠,同时为未来自然语言定义技能奠定基础。(149字

美国初创公司Arcee AI发布4000亿参数开源大模型Trinity Large及其小型变体,采用混合专家架构和滑动窗口注意力技术。中国公司月之暗面同期推出万亿参数开源模型Kimi K2.5,在性能上超越专有模型,并支持多模态处理。StepFun的Step 3.5 Flash以1960亿参数实现高推理速度,采用多token预测技术。阿里Qwen3团队发布的800亿参数编程专用模型Qwen3-Co
本文探讨了使用LangChain框架进行工具调用的复杂性。作者指出,尽管使用了LangChain,处理JSON body和工具调用仍然繁琐,涉及类型转换、工具注册和参数映射等步骤。文章展示了如何定义一个文件检查工具LsTool,并通过convert_to_openai_tool将其转换为OpenAI兼容格式。最后演示了与LLM交互时如何处理工具调用循环,包括发送消息、处理工具响应和追加结果到对话上
摘要:研究通过双对数坐标分析AI工作负载的成本-用量关系,揭示了四类典型分布:1)高端工作负载(高成本高用量,如技术领域);2)大众市场驱动者(低成本高用量,如编程和角色扮演);3)专业领域(高成本低用量,如金融和健康);4)利基工具(低成本低用量,如翻译)。开源模型主导低成本区域,而闭源模型占据高价值市场。研究发现存在"杰文斯悖论"效应:成本降低反而刺激总用量增长,同时模型质

国内开发者尝试用DeepSeek大模型实现类似OpenAI的语音交互功能,通过组合sherpa_onnx语音识别、DeepSeek文本处理和pyttsx3语音合成的"曲线救国"方案,虽能运行但存在延迟高、资源消耗大等局限。分析指出要实现真正竞争力的语音交互,需在模型、接口、优化和生态层面进行改进。尽管当前方案不够完善,但展示了国产大模型在多模态发展上的潜力,开发者需保持耐心并积
本文提出"上下文工程"作为大语言模型交互的新范式,突破了传统提示工程的局限性。通过数学形式化将上下文定义为动态结构化组件集合,建立系统性优化框架。文章系统梳理了上下文工程的基础组件(检索生成、处理优化、管理挑战),揭示其处理长文本、结构化数据和状态维护等核心问题的技术路径。特别指出上下文窗口约束、位置偏见等关键挑战,并提出多智能体分布式处理等解决方案。研究为构建高效、可扩展的大

本文探讨了SeekDB与LangChain的集成方案,聚焦智能文档检索与分析系统的架构设计与实际应用效果。该系统通过混合搜索工具(均衡/语义/关键词/精确四种模式)处理Nike财报文档,结合OceanBase向量数据库实现多索引并行查询。测试显示,在回答业务板块划分、营收数据等具体问题时,系统展现出较高的准确率(Pass@3达100%)。开发者重点关注了架构兼容性(支持30+AI框架)、Token

本文介绍了在Mac电脑上部署SenseVoice语音转文字服务的步骤。首先通过Git克隆项目代码,然后创建Dockerfile配置Python环境和依赖项(采用CPU版本的PyTorch)。启动容器后映射7860端口即可访问服务。对于苹果设备的音频文件,建议使用ffmpeg将.m4a格式转换为.wav格式后再进行处理。整个过程实现了从代码下载到服务部署的完整流程,适用于无GPU环境的Mac用户。

DeepSeek v3.1 昨天写个前端还好,今儿上午思考模式就死循环了。








