logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI一周事件(2025年7月1日-7月8日)

(以下借助 DeepSeek-R1 & ChatGPT 辅助整理)

#人工智能#AI
AI一周事件(2025年5月20日-5月26日)

AI技术新进展与行业动态摘要 全球AI领域近期迎来多项突破:Anthropic发布Claude4系列模型,编程能力领先并获企业级安全认证;OpenAI全面开放GPT-4o多模态API,推动交互实用化;Meta开源多模态模型Chameleon,补足生态短板;微软发布三大AI平台,打通智能体开发全链路。国内方面,阿里云推出通义千问2.5及智能体平台,百度发布自研文心一言4.5,华为昇腾算力集群实现技术

#人工智能#AI
AI一周事件(2026年01月14日-01月20日)

本周AI产业动态呈现两条主线:1)AI从“模型能力”向“执行力与场景落地”迁移;2)算力扩张瓶颈从芯片供给转向能源与电网基础设施,同时政策与治理进入深水区。技术观点:智能体、规划型模型、可解释性与合规审计成为企业落地的关键能力方向。AI基础设施的核心约束从算力供给转向电网与绿色能源,影响全球算力中心布局。AI商业化加速进入“物理世界+供应链+场景落地”阶段,产业竞争更强调软硬协同与数据资产。政策与

#人工智能#AI
AI一周事件(2025年10月9日–10月14日)

AI周报(2025.10.9-10.14):算力升级与智能体进化 本周AI领域呈现三大趋势:1)算力基础设施深化:OpenAI与Broadcom合作开发10吉瓦AI加速器,北大研发高精度模拟计算芯片,英诺赛科与NVIDIA推进800V GaN电源方案;2)智能体长期学习突破:Google提出"Reasoning Memory"框架,赋予AI持续推理进化能力;3)应用场景多元化:

#AI#人工智能
[笔记.AI]不同大模型的向量化结果差异

(下面借助 DeepSeek-V3 生成)。:例如,BERT-base 的嵌入维度为 768,而 GPT-3 的嵌入维度为 12288(通过多层堆叠实现),向量空间的结构完全不同。:BERT 使用双向注意力,生成的向量包含全局上下文信息;而 GPT 采用单向自回归,向量更侧重左侧上下文。:如 Transformer 层数越多(如 GPT-3 有 96 层),向量经过更多非线性变换,语义抽象程度更高

文章图片
#人工智能
思维革命:DeepSeek-R1-0528 如何用一次小更新颠覆大模型格局

DeepSeek-R1-0528 虽名义为“小版本”,却以扎实的推理深度重构、幻觉控制突破和开源诚意,重新定义了大模型的竞争高度。其87.5% 的AIME准度与接近GPT-4o/Claude 4的综合表现,不仅是技术里程碑,更是中国AI从追赶到并跑的关键转折。正如网友所言:“一个小更新尚且如此,R2 会多强?此刻,全球AI的格局已静默改写。🔗DeepSeek-R1-0528 HuggingFac

文章图片
#AI#人工智能
OpenAI 推出系列新工具,简化 AI Agent 的开发

可在Responses API中使用,适用于gpt-4o和gpt-4o-mini模型,包括引文支持。也在Chat Completions API中通过gpt-4o-search-preview和gpt-4o-mini-search-preview模型提供。在SimpleQA基准测试中,gpt-4o得分90%,gpt-4o-mini得分88%,相比没有搜索的GPT-4.5(63%)有显著提升。默认情

文章图片
#AI#开源
[思考记录.AI]关于Deepseek-r1的思维链

以前在使用某些AI大模型时,为了获得相对更好的输出,一种方式是在提示词上下功夫——除了交代任务背景,甚至建议对复杂任务预设处理步骤、提供模板案例等。夸张点说就是,做个功能页面,将所需方法及其主体逻辑都描述出来(近乎去写出伪代码)。这显然还是比较费事(但也有研究说,部分模型仅通过添加"请逐步思考"等引导语也可显著提升输出质量)。而在使用 Deepseek-R1 或 ChatGPT-o 时,似乎并不推

文章图片
#人工智能#AI
[笔记.AI]大模型训练 与 向量值 的关系

在预训练阶段(如BERT、GPT的初始训练),模型的嵌入层(Embedding Layer)作为可训练参数,通过反向传播不断优化。词汇“苹果”在初始时可能随机分布,但经过训练后,其向量会靠近“水果”或“公司”(取决于上下文频率)。通用语料训练的向量可能无法准确表示专业术语(如医疗词汇“化疗”需更接近“癌症”而非日常语境)。新词汇(如“元宇宙”)或词义变化(如“直播”从电视到互联网)需更新向量。:解

文章图片
#人工智能
AI一周事件(2025年7月22日-7月29日)

尖端探索:GPT-5的系统化架构、DeepSeek R1的低成本突破、Gemini 2.5的搜索集成等,标志着AI技术从单点突破转向复杂系统集成,推理与多模态能力显著提升。产业深耕:WAIC展示的算力、机器人与行业应用成果,反映了AI从展示性技术向效率提升与成本优化的转型,特别是在中国市场,政策驱动与技术创新形成合力。

#人工智能#AI
    共 90 条
  • 1
  • 2
  • 3
  • 9
  • 请选择