登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
Google推出多模态AI模型Gemini 3.5 Flash,具备100万token上下文窗口和64K输出上限,支持文本、图像、音频、视频输入。该模型在智能体编程、真实世界任务和多模态理解方面超越前代Pro版本,速度达每秒290个token,成本仅为竞争产品的三分之一。虽然Flash在多数任务上表现优异,但在极限推理和长上下文任务中仍略逊于Pro版本。同时,Google还发布了视频生成模型Gem
摘要: OpenCode 接入 Claude 后费用暴增的核心原因是缓存失效,而非模型本身变贵。与 OpenAI 自动缓存不同,Claude 需通过 cache_control 显式启用缓存,而 OpenCode 的提示词组织方式、OpenAI 兼容网关的协议转换可能导致缓存标记丢失。此外,动态内容污染前缀也会破坏缓存命中率。解决方案包括:确认工具支持 Claude 缓存、优先使用原生协议、分离稳
DeepSeek发布全新V4系列模型,推出Pro和Flash两个版本。V4-Pro性能媲美顶级闭源模型,在Agent能力、世界知识和推理性能方面表现突出,支持1M超长上下文处理。V4-Flash则是更经济的版本,适合日常场景。新模型采用创新的注意力机制,显著降低长上下文处理的资源消耗。API服务已同步更新,旧接口将在三个月后停用。DeepSeek坚持开源策略,让开发者自由使用这些先进技术。
国内AI行业资深分析师指出,GLM-5.1此次在核心基准测试中取得的突破,不仅标志着国产开源模型首次登顶全球核心评测榜单,更意味着开源模型在核心通用能力上,首次实现了与全球顶级闭源模型的比肩乃至超越,以客观、可量化的测试数据,证实了开源模型在核心技术领域的发展潜力与突破空间。区别于全球大模型行业过去一年普遍采用的低价竞争、以价换量的主流发展策略,智谱AI针对GLM-5.1模型采取了定价上调10%的
本文提供了一份AI辅助Python开发的实用指南,包含API接入、代码生成、错误修复、性能优化、单元测试编写等全流程自动化技巧。通过具体案例演示了如何用自然语言指令让AI生成高质量代码,包括爬虫、数据分析和Web服务开发。文章还介绍了本地部署开源代码模型的方法,以及编写高效Prompt的三要素法则。从API调用到离线部署,帮助开发者显著提升编码效率,实现"用AI写代码"的自动化
本文提出利用RAG技术为AI对话系统添加记忆功能,通过本地JSON文件存储聊天记录,并基于向量相似度检索相关对话片段。该方法包含四个核心模块:记忆存储模块实现JSON文件读写;向量化模块调用云端API将文本转为向量;检索模块计算余弦相似度获取相关记忆;生成模块将检索结果融入提示词。该方案有效解决传统无状态系统的"遗忘"问题,使用Python实现云端API调用,降低了开发门槛,使AI在长对话中保持连
Opus4.7版本在性能上有所提升,主要改进包括:软件工程能力(SWE-bench得分提升6.8%)、视觉推理能力(XBOW测试从54.5%跃升至98.5%)和多学科推理能力。新版本采用新tokenizer,输入token数增加1.0-1.35倍,但价格不变。新增xhigh档位和/ultrareview命令,优化了成本控制和代码审查。虽然部分测试如AgenticSearch得分略有下降,但整体性能
本文介绍了两种用Python构建规则驱动对话系统的方法:1. 使用re库实现简单关键词匹配,通过正则表达式定义应答规则,适合问候、天气查询等固定场景;2. 使用pyknow库实现复杂规则推理,支持多条件组合判断(如医疗症状咨询),通过Fact(事实)和Rule(规则)实现"如果...就..."的逻辑推理。文章包含详细代码示例和解释,帮助读者从零开始构建规则引擎,并提供了动手练习
本文提供了一个7天Python编程入门教程,帮助零基础学习者快速构建能调用外部工具的AI智能体。教程从Python基础安装开始,逐步讲解API调用、Function Calling原理,最终实现结合大模型决策与真实天气API的智能应用。重点包括:Python基础语法(顺序/判断/循环)、OpenAI API对接、工具函数设计、ReAct决策循环实现,以及将本地模拟数据替换为真实联网查询(心知天气A
Python写累了?让AI替你干活!本文保姆级教程:调用大模型API、自动生成爬虫、AI改Bug、本地部署代码模型。全程截图跟做,看完直接效率翻倍。建议先收藏再阅读! 一、获取并接入API 01访问AIO通用智能服务平台注册账号 (https://api.aiearth.dev) 02点击左上方控制台,进入数据看板 03点击左侧令牌管理 04点击添加令牌 05 在这里,