logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLaMa-Factory K8s 部署记录:llamafactory-cli webui 无法访问的 Ingress 路由规则配置调整

启动的 WebUI 服务无法通过 Ingress 访问,需调整 Ingress 路由规则以解决访问问题。修改 Ingress 资源,确保路径规则指向正确的 Service 和端口。在 Kubernetes 集群中部署 LLaMa-Factory 时,通过。若不一致,需调整 Service 或 Ingress。若未安装,需参考官方文档部署对应的 Ingress 控制器。确认 WebUI 服务的端口(

#kubernetes#容器#云原生
Elasticsearch 云原生化:使用 ECK(Elastic Cloud on Kubernetes)部署 ES 集群

ECK(Elastic Cloud on Kubernetes)是 Elastic 官方提供的 Kubernetes Operator,用于自动化部署和管理 Elasticsearch、Kibana 等组件。

#云原生#elasticsearch#kubernetes
昇腾算子性能工具:Llama 3.2 1B 与 3B 中文对比分析

指标计算公式: $$ \text{Throughput} = \frac{B \times N}{T_{\text{total}}} $$ 其中 $B$ 是batch size,$N$ 是样本数,$T_{\text{total}}$ 是总推理时间。延迟定义为 $T_{\text{latency}} = \frac{T_{\text{total}}}{N}$。公式: $$ \text{算子效率} =

#人工智能
Elasticsearch 云原生化:使用 ECK(Elastic Cloud on Kubernetes)部署 ES 集群

ECK(Elastic Cloud on Kubernetes)是 Elastic 官方提供的 Kubernetes Operator,用于自动化部署和管理 Elasticsearch、Kibana 等组件。

#云原生#elasticsearch#kubernetes
昇腾算子性能工具:Llama 3.2 1B 与 3B 中文对比分析

指标计算公式: $$ \text{Throughput} = \frac{B \times N}{T_{\text{total}}} $$ 其中 $B$ 是batch size,$N$ 是样本数,$T_{\text{total}}$ 是总推理时间。延迟定义为 $T_{\text{latency}} = \frac{T_{\text{total}}}{N}$。公式: $$ \text{算子效率} =

#人工智能
聚焦混合云架构:MCP 持有者 3 年晋升云计算技术专家

通过这个3年计划,MCP持有者能系统性地晋升为云计算技术专家:第一年打基础,第二年深化混合云专长,第三年实现专家影响力。认证驱动:每年至少1个高级认证。实践优先:将学习应用到真实项目,构建作品集。社区参与:分享经验(如技术博客或Meetup),提升行业可见度。混合云领域需求旺盛,据行业数据,专家级角色薪资可达基础岗位的2倍。记住,晋升公式本质是: $$ \text{成功} = \text{知识}

#架构#云计算
【AI 辅助开发系列】IntelliCode 在 Visual Studio 中加载缓慢:资源配置与缓存清理步骤

临时切换至轻量级替代方案如 IntelliSense,或降低模型精度设置。考虑升级至 Visual Studio 2022 64 位版本,其内存管理机制有显著改进。IntelliCode 在 Visual Studio 中加载缓慢通常与系统资源分配、模型缓存或网络连接有关。高性能硬件配置下仍出现延迟时,需检查后台进程或优化设置。通过扩展管理器检查更新,或手动从 Marketplace 下载最新版本

#visual studio#缓存#spring
Epoll 封装实战指南:Reactor 模式下 IO 多路转接服务器的设计逻辑

$P(\text{事件触发}) = \frac{\lambda_{\text{请求}}}{\mu_{\text{处理能力}}} \quad \text{当} \ \lambda < \mu$$工具分析热点函数,重点关注 $ \text{epoll_wait()} $ 调用频率与事件处理时延的平衡点。Reactor 模式通过。

#服务器#运维
到底了