logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Github上线DeepSeek 百万token窗口实证研究:中英文万字分析报告,PDF,图表,代码

本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。高密度综合:在对话末期,模型可基于全部历史上下文,自主生成涵盖 80% 以上关键内容的精炼摘要,并撰写包含所有技术细节的完整项目报告。本报告包含了详细的过程数据、

文章图片
#github#人工智能
以deepseek 百万token窗口为上限,建立上下文窗口的“信噪比”量化标准

通过对 DeepSeek 百万 Token 基准的深度复现与分析,发现长上下文中存在高达。这套方法不仅解释了为何某些模型在长窗口下表现衰退,更为未来的数据预处理提供了可量化的。欢迎同行批评指正,共同推动长窗口研究从“拼长度”走向“拼质量”。盲目增加长度并不等于提升智能。

文章图片
#推荐算法
Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录

摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。

#人工智能
Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录

摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。

#人工智能
Deepseek百万Token窗口的极限实践:一个真实项目的全景记录与分析

关于本文(文本为上一篇简述的完整版本)DeepSeek百万token窗口发布两周,目前所见讨论多为技术参数推演或短期体验。本文作者第一时间在新版百万token窗口里,尝试了持续数十小时、上千轮次对话、总token逼近百万上限的真实项目开发,此文为全景实录与分析。作者为非AI专业背景的研究者(医学、心理学、人文学科),在完全依赖云端免费模型的条件下,完成了从工作站环境设置、数据库搭建、向量化处理到元

#人工智能
Github上线DeepSeek 百万token窗口实证研究:中英文万字分析报告,PDF,图表,代码

本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。高密度综合:在对话末期,模型可基于全部历史上下文,自主生成涵盖 80% 以上关键内容的精炼摘要,并撰写包含所有技术细节的完整项目报告。本报告包含了详细的过程数据、

文章图片
#github#人工智能
以deepseek 百万token窗口为上限,建立上下文窗口的“信噪比”量化标准

通过对 DeepSeek 百万 Token 基准的深度复现与分析,发现长上下文中存在高达。这套方法不仅解释了为何某些模型在长窗口下表现衰退,更为未来的数据预处理提供了可量化的。欢迎同行批评指正,共同推动长窗口研究从“拼长度”走向“拼质量”。盲目增加长度并不等于提升智能。

文章图片
#推荐算法
基于 DeepSeek 百万 token 窗口的 3673 轮对话实录

摘要本文基于 DeepSeek 百万 token 上下文窗口的真实对话记录(1 274 201 tokens,3 673 轮),系统性地分析了长达数十小时的人机协作过程。研究构建了 L1 基础数据层 → L2 项目演进层 → L3 关键转折层 → L4 互动模式层 → L5 情感记忆层 的五层分析框架,完整呈现了一位非 AI 专业背景的研究者(医学、心理学与人文领域)在完全依赖云端免费模型的条件下

#人工智能
可计算元认知文本分析:跨领域语义漂移的多层解释框架与实证研究

背景:跨领域语义漂移(semantic drift)是自然语言处理与知识融合中的核心障碍。前期研究已构建了三种量化手段——Jaccard(结构漂移)、Word2Vec(语义漂移)与 SBERT(句子级漂移),但仅提供“漂移多少”的数值,缺乏可解释性与因果解释。结论:四层框架实现了从“是否漂移” → “漂移多少” → “为何漂移” → “如何漂移”的完整链路,为跨领域知识对话提供了量化 解释 因果

#数据挖掘#数据分析
三个DeepSeek百万Token窗口与一个长程项目:记忆迁移、协作特点与窗口资源利用模式分析

本文基于三个DeepSeek百万Token上下文窗口的长程项目实证数据,对窗口一(项目启动与环境搭建)、窗口二(窗口特性实验研究与论文)及窗口三(构建项目工程框架)的量化分析。结果显示,三个窗口的token数(cl100k base)高度一致,说明窗口内容与交互模式决定了各种主要指标的差异。随着项目阶段的推进,单轮对话平均字数呈上升趋势,AI/User Token产出比显著提升,且文本符号构成随任

文章图片
#人工智能
    共 25 条
  • 1
  • 2
  • 3
  • 请选择