
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。高密度综合:在对话末期,模型可基于全部历史上下文,自主生成涵盖 80% 以上关键内容的精炼摘要,并撰写包含所有技术细节的完整项目报告。本报告包含了详细的过程数据、

通过对 DeepSeek 百万 Token 基准的深度复现与分析,发现长上下文中存在高达。这套方法不仅解释了为何某些模型在长窗口下表现衰退,更为未来的数据预处理提供了可量化的。欢迎同行批评指正,共同推动长窗口研究从“拼长度”走向“拼质量”。盲目增加长度并不等于提升智能。

摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。
摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。
关于本文(文本为上一篇简述的完整版本)DeepSeek百万token窗口发布两周,目前所见讨论多为技术参数推演或短期体验。本文作者第一时间在新版百万token窗口里,尝试了持续数十小时、上千轮次对话、总token逼近百万上限的真实项目开发,此文为全景实录与分析。作者为非AI专业背景的研究者(医学、心理学、人文学科),在完全依赖云端免费模型的条件下,完成了从工作站环境设置、数据库搭建、向量化处理到元
本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。高密度综合:在对话末期,模型可基于全部历史上下文,自主生成涵盖 80% 以上关键内容的精炼摘要,并撰写包含所有技术细节的完整项目报告。本报告包含了详细的过程数据、

通过对 DeepSeek 百万 Token 基准的深度复现与分析,发现长上下文中存在高达。这套方法不仅解释了为何某些模型在长窗口下表现衰退,更为未来的数据预处理提供了可量化的。欢迎同行批评指正,共同推动长窗口研究从“拼长度”走向“拼质量”。盲目增加长度并不等于提升智能。

摘要本文基于 DeepSeek 百万 token 上下文窗口的真实对话记录(1 274 201 tokens,3 673 轮),系统性地分析了长达数十小时的人机协作过程。研究构建了 L1 基础数据层 → L2 项目演进层 → L3 关键转折层 → L4 互动模式层 → L5 情感记忆层 的五层分析框架,完整呈现了一位非 AI 专业背景的研究者(医学、心理学与人文领域)在完全依赖云端免费模型的条件下
背景:跨领域语义漂移(semantic drift)是自然语言处理与知识融合中的核心障碍。前期研究已构建了三种量化手段——Jaccard(结构漂移)、Word2Vec(语义漂移)与 SBERT(句子级漂移),但仅提供“漂移多少”的数值,缺乏可解释性与因果解释。结论:四层框架实现了从“是否漂移” → “漂移多少” → “为何漂移” → “如何漂移”的完整链路,为跨领域知识对话提供了量化 解释 因果
本文基于三个DeepSeek百万Token上下文窗口的长程项目实证数据,对窗口一(项目启动与环境搭建)、窗口二(窗口特性实验研究与论文)及窗口三(构建项目工程框架)的量化分析。结果显示,三个窗口的token数(cl100k base)高度一致,说明窗口内容与交互模式决定了各种主要指标的差异。随着项目阶段的推进,单轮对话平均字数呈上升趋势,AI/User Token产出比显著提升,且文本符号构成随任








