网安蟹佬霸个人主页

@xlb8888888

网安蟹佬霸

2026-04-28 20:12:05 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

容器与云原生安全：Docker 和 K8s 背后的风险

随着企业全面上云、全面容器化，容器安全已经成为云安全的主战场。懂 Docker、K8s、又会安全的人，未来几年会非常抢手。扫码领取《网络安全资料》包含：学习路线 / 视频教程 / 电子书籍 / 工具清单 / 实战靶场 / 面试题库 / 技术社区本文由「网络安全学习笔记」原创整理，转载请注明出处。扫描文中二维码可领取更多学习资料和课程信息。

#云原生 #安全 #docker +4

Gemini 3.5 Flash发布：输出速度4倍于GPT-5.5，谷歌最强Agent模型免费开放

谷歌在2026年I/O大会上发布免费AI模型Gemini 3.5 Flash，性能全面超越竞争对手。该模型输出速度达280token/秒，是GPT-5.5的4倍，支持100万token上下文窗口，并在编程和智能体任务中表现优异。谷歌还展示了93个AI智能体协同12小时构建操作系统的突破性成果。这一免费开放策略将重塑AI行业格局，迫使竞争对手重新评估商业模式。开发者可立即通过Gemini App免费

#microsoft #数据库

Go与Python深度对比：语法、并发、性能与适用场景解析

本文对比分析了Python和Go两种主流编程语言的核心特性。从语法体系看，Python作为动态类型语言提供开发灵活性，而Go的静态类型系统确保编译期安全；面向对象设计上，Python采用传统继承模型，Go则通过结构体和接口实现组合式多态；并发处理方面，Python受限于GIL采用协程机制，Go则原生支持高性能Goroutine；数据处理时Python动态解析JSON更灵活，Go强类型映射更安全；错

#golang #python #开发语言

DeepSeek首轮融资500亿落地：腾讯+宁德时代入局，估值破4000亿意味着什么

摘要：2026年6月3日，中国AI公司DeepSeek宣布完成500亿元首轮融资，投后估值达3500-4000亿元（约590亿美元），成为中国AI领域里程碑事件。本轮融资由腾讯（100亿元）、宁德时代和创始人梁文锋（自投200亿元）共同参与，形成"算力+能源"战略布局。腾讯将提供云基础设施支持，宁德时代聚焦能耗管理，创始人跟投彰显信心。此次融资标志中国AI竞争从算力军备转向&q

#人工智能

Kimi K2.7 Code开源发布：token消耗降30%，高速版5倍速今日登场

2026年6月12日，月之暗面（Moonshot AI）正式发布并开源Kimi K2.7 Code编程大模型，同步在Hugging Face平台开放权重下载。这是继4月K2.6发布后仅两个月的一次重要迭代，聚焦于编程能力的深度优化与推理效率的全面提升。新模型在Kimi Code Bench v2基准测试中分数提升21.8%，平均token消耗降低30%，Agent自主执行能力提升约10%。

#开源

Google开源DiffusionGemma：26B MoE扩散语言模型，放弃自回归实现4倍推理加速

2026年6月11日，Google正式发布实验性开源模型DiffusionGemma，以Apache 2.0许可证开放。这是一款基于文本扩散（Text Diffusion）机制构建的大语言模型，采用26B参数的MoE（Mixture of Experts，混合专家）架构，推理时仅激活约3.8B参数。与传统自回归（Autoregressive）大语言模型逐token顺序生成的方式不同，Diffusi

#开源 #语言模型 #回归

xAI并入SpaceX：马斯克重构算力版图与开发者实战指南

2026年5月，马斯克宣布解散xAI并将其Grok业务并入SpaceX，成立SpaceXAI部门。同时，SpaceXAI将搭载22万块英伟达GPU的超算集群转租给Anthropic，大幅提升了Claude系列模型的API调用能力。本文分析了此次重组的行业逻辑，并为开发者提供了API调用实践指南，包括基础集成、异步高并发调用等示例代码。算力释放后，开发者可以更高效地利用Claude模型进行大规模数据

#人工智能

OpenAI砸40亿美元成立DeployCo，从卖模型到做服务的战略转型

OpenAI战略转型：40亿美元成立DeployCo，收购Tomoro并发布小型化模型GPT-5.4系列，标志着从模型供应商向企业AI服务商的转变。DeployCo将提供定制化部署服务，Tomoro带来行业know-how，小型模型降低部署门槛。这一组合拳重构了AI商业化路径，将推动行业从模型能力竞争转向落地服务竞争，重塑AI咨询和基础设施市场格局。开发者需关注混合模型架构、部署工具链和企业级工程

#人工智能 #大数据

用vLLM部署Llama 4 Mini实战：3步实现本地高性能推理

摘要： 2026年5月，Meta发布Llama4系列开源模型，其中Llama4 Mini采用MoE架构，单卡推理能力接近70B模型。本文介绍使用vLLM高效部署Llama4 Mini的方法，实现5倍于原生Transformers的推理速度（≥200 tokens/s）。重点包括：环境配置：推荐RTX 4090（24GB显存）+CUDA 12.1，通过vLLM支持FP16精度与FlashAtten

QLoRA微调Qwen3实战：4卡A100训练领域模型的完整流程

本文介绍了使用QLoRA技术在4张A100 80G GPU上微调Qwen3-72B大语言模型的完整流程。QLoRA通过4-bit量化和LoRA技术，将72B参数模型的显存需求从640GB降至约40GB，实现高效微调。文章详细讲解了从数据准备、模型加载、训练配置到vLLM部署的全过程，包括数据清洗、量化参数设置、LoRA适配器配置等关键步骤，并提供了常见问题的解决方案。该方法在保持模型性能的同时大幅

#人工智能 #大数据 #云计算

共 44 条

请选择