
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
国内AI厂商纷纷推出开发者支持计划,包括百度文心千帆、阿里通义千问、腾讯混元、华为盘古等。各计划提供免费资源、开发工具和云服务支持,如百度低门槛智能体开发、阿里全栈云+模型试用、腾讯10亿级免费token等。厂商针对不同场景优化,如内容创作(字节)、语音交互(讯飞)、视觉算法(商汤)。初创企业可根据业务类型选择,内容类推荐百度/字节,企业服务选阿里/华为,移动应用考虑腾讯/讯飞。建议开发者先试用免

开源项目助力个人开发者快速入门AI应用开发。GitHub上的《中国独立开发者项目列表》提供多种适合个人开发的小项目方向,结合AI工具可快速实现创意落地。2025年AI辅助开发更趋成熟,即使非技术背景也能通过提示词技巧搭建产品原型。建议开发者选择创新方向(如AI+中医药)替代同质化项目,并通过专业包装提升项目价值。面试时善用行业术语和技术逻辑,能有效建立专业形象。这种实践方式既能积累经验,又能为简历

摘要: Skills作为AI智能体的"技能包"正引发热潮,其核心价值在于将复杂流程固化为可复用的自动化模块。通过两个案例(AI选题系统、整合包生成器)展示了Skills如何将数小时工作压缩为一键指令。与Prompt(临时指令)、MCP(权限管理)不同,Skills如同SOP手册,支持渐进式调用和持续迭代。配置Skills只需规范命名的文件夹和SKILL.md文件(含YAML元数

GPTQ是一种高效的模型量化方法,通过将权重量化为4位整数来压缩大规模语言模型,同时保持激活值为16位浮点数。它能显著提升推理速度(最高达4.5倍)并减少内存占用(节省近4倍),使其适合在资源有限的设备上部署。量化过程仅需少量数据校准,无需重新训练,175B参数的模型约4小时即可完成。虽然依赖GPU且仅支持4位量化可能影响精度,但GPTQ仍是快速优化大模型的理想选择,特别适用于提升推理速度和降低资

本教程介绍如何使用Supabase和Vecs库实现向量存储与搜索。首先在Supabase项目中启用pgvector扩展并获取连接字符串。安装vecs和supabase后,初始化客户端并创建向量集合。插入带元数据的向量数据,执行相似性搜索(默认余弦距离)。还涵盖查询、删除和索引优化等操作,适用于语义搜索和推荐系统等场景。注意向量维度一致性等关键细节。

齐鲁制药招聘实验室信息化AI工程师,负责实验信息化系统运维、业务支持及AI赋能。岗位要求计算机/药学本科以上学历,2年以上实验信息化系统管理经验,熟悉SQL、Linux/Windows服务器及Python开发,具备API集成经验。优先考虑有智能体平台项目经验或主导过实验室数字化项目的候选人。工作地点济南,需具备跨部门协作能力,将技术方案转化为业务解决方案。

本文介绍了工作流系统的Python SDK和HTTP API。SDK通过Workflow类提供工作流加载和运行功能,支持从文件加载、无AI模式运行和常规模式运行。HTTP API基于FastAPI实现,提供工作流管理(列表、详情、更新)和执行(启动、状态查询、日志获取、取消)接口。此外还包含CLI工具,支持生成工作流和运行存储的工作流。这些接口覆盖了工作流系统的核心功能,适用于不同场景的使用需求。

摘要: Metal是Apple专为macOS/iOS设备打造的图形计算API,其Metal Performance Shaders(MPS)通过GPU加速实现高效的大模型端侧推理。相比传统方案,Metal利用Apple Silicon的统一内存架构,避免CPU/GPU数据拷贝,显著提升性能。本文详细介绍了Metal环境搭建(需M1及以上芯片、macOS 13.0+)、核心API使用(包括Metal

vLLM是伯克利开源的高效大模型推理框架,通过PagedAttention分页机制和连续批处理技术显著提升推理性能,支持主流大模型在端侧和云端部署。该框架安装简便,提供Python SDK和REST API,核心API包括LLM类(推理引擎)和SamplingParams(采样控制)。实战案例展示了如何构建求职咨询对话系统和批量岗位描述生成工具,适用于应届生导航网站等场景。vLLM通过优化显存管理

Elasticsearch核心应用场景概览 Elasticsearch以其强大的全文检索、实时分析和可扩展查询能力广泛应用于多领域: 搜索场景:支持电商商品、文档知识库、招聘房产等垂直领域的多条件检索与模糊匹配 日志分析:实时处理系统日志、运维监控指标及安全审计数据,快速定位问题 实时计算:赋能业务统计、LBS定位和推荐系统,支持地理位置与用户行为分析 企业应用:提升客服响应效率、实现内部信息统一








