logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

实战复盘:自研 Office / PDF 文档处理平台的高坑预警与 AI Agent 时代架构思考

文档内容处理从表面看是简单的功能模块,实则隐藏着极高的工程门槛。随着AIAgent技术的发展,文档处理正从"人工操作"演变为"Agent调用的基础能力",对稳定性、自动化程度和业务语义理解提出了更高要求。文章揭示了Office/PDF文档的深层复杂性(XML结构、排版范式差异),指出自研需要具备文档规范理解、XML调试、工程容错等核心能力,并强调业务理解比技

文章图片
#人工智能#编辑器#架构 +1
多人协同编辑Excel时,筛选相互干扰怎么办?Onlyoffice中国版给出了与WPS一样的答案

Onlyoffice中国版针对多人协作Excel时的筛选干扰问题进行了创新性优化。该版本在保持数据一致性的前提下,通过前端隔离和后端状态管理,实现了筛选、排序等操作的独立视图功能。与开源版不同,中国版允许协作者各自筛选数据而互不影响,解决了财务分析、项目管理等场景下的协作痛点。这一增强使Onlyoffice在协同体验上更接近WPS和Excel,显著提升了团队协作效率。目前该功能仅在中国版提供,用户

文章图片
#开源软件#编辑器
企业协同文档工具(WebOffice)选型指南:从微软、金山到开源封装的全面解析

摘要:企业信息化推动在线协同文档编辑需求增长,本文介绍主流WebOffice工具及其核心功能(实时同步、版本管理、权限控制等)。市场分为四类厂商:微软Office365(订阅制)、国产自主研发(金山、永中)、大型厂商轻文档(腾讯等)、封装产品(基于开源或桌面Office)。对比金山、永中等产品在功能、多端支持、部署方式等方面的差异,为技术选型提供参考,满足不同企业对文档格式、安全性和协同效率的需求

文章图片
#前端#编辑器
BaseMetas Fileview 开源在线文件预览引擎首发:面向社区,免费赋能

BaseMetasFileview社区版是一款开源在线文档预览引擎,旨在解决数字时代文件格式壁垒问题。该产品支持200+种文件格式(包括Office文档、CAD图纸、代码等),采用异步解耦架构,提供安全可控的预览服务。核心优势包括:完全开源(2026年Q1发布源码)、文档不落地预览、标准化API接口。适用于OA系统、知识管理、教育科研等多个场景。开发者可免费试用并参与未来开源共建,共同打造企业级文

文章图片
#开源#开源软件#中间件
大模型价格战背后的技术革命:剖析DeepSeek-V3.2的DSA稀疏注意力

DeepSeek发布V3.2-Exp实验模型,引入原创DeepSeek稀疏注意力(DSA)技术,通过"闪电索引器"智能筛选关键Token,将计算复杂度从O(L²)降至O(L·k)。该技术使长文本处理速度提升2-3倍,内存占用降低30-40%,API调用成本下降超50%,同时保持与V3.1-Terminus相当的性能。作为迈向新一代架构的关键步骤,DSA采用三阶段训练策略平衡效率

文章图片
#人工智能#transformer#语言模型
实战复盘:自研 Office / PDF 文档处理平台的高坑预警与 AI Agent 时代架构思考

文档内容处理从表面看是简单的功能模块,实则隐藏着极高的工程门槛。随着AIAgent技术的发展,文档处理正从"人工操作"演变为"Agent调用的基础能力",对稳定性、自动化程度和业务语义理解提出了更高要求。文章揭示了Office/PDF文档的深层复杂性(XML结构、排版范式差异),指出自研需要具备文档规范理解、XML调试、工程容错等核心能力,并强调业务理解比技

文章图片
#人工智能#编辑器#架构 +1
大语言模型基础-Transformer之上下文

摘要:上下文是NLP中理解语言单元的关键环境信息,能消除歧义、维持连贯性和支持推理。与优化输入设计的上下文工程不同,上下文本身是模型处理的信息基础。原始Transformer受限于O(n²)计算复杂度,难以处理长上下文。目前通过稀疏注意力、递归机制、记忆库等技术创新,已实现百万级上下文处理,推动了大模型在复杂任务中的应用。这些进步为AI处理长文本、多轮对话等场景提供了技术支撑。

文章图片
#语言模型#transformer#人工智能
数据、算法、机器:量化交易真正的护城河

AI 量化交易,并不是“算得更准”,而是“跑得更快、犯错更少、活得更久”。理解这一点,才能真正理解量化交易在市场中的位置。AI 并没有改变金融市场的本质,它只是把“人与人的竞赛”推向了更高效、更残酷的层面。我是在和谁竞争?我的优势在哪里?我是否非要参加这场“跑步比赛”?理解这些问题,远比站队支持或反对 AI,更重要。

文章图片
#人工智能#算法#语言模型 +1
深入解析提示语言模型校准:从理论算法到任务导向实践

摘要 大模型输出校准技术研究面临三大核心挑战:表面形式竞争导致的概率低估、任务特异性偏差以及过度自信问题。本文系统探讨了提示校准的理论基础与评估指标,提出了任务导向的校准方法:分类任务中采用贝叶斯潜变量模型和后验概率校准,生成任务中运用CritiCal框架和序列概率校准。通过金融风控和医疗报告生成等实际案例,验证了校准技术能显著提升模型可靠性。未来发展趋势包括自适应校准框架、混合任务校准以及效用感

文章图片
#语言模型#算法#人工智能
大语言模型基础-Transformer之上下文

摘要:上下文是NLP中理解语言单元的关键环境信息,能消除歧义、维持连贯性和支持推理。与优化输入设计的上下文工程不同,上下文本身是模型处理的信息基础。原始Transformer受限于O(n²)计算复杂度,难以处理长上下文。目前通过稀疏注意力、递归机制、记忆库等技术创新,已实现百万级上下文处理,推动了大模型在复杂任务中的应用。这些进步为AI处理长文本、多轮对话等场景提供了技术支撑。

文章图片
#语言模型#transformer#人工智能
    共 11 条
  • 1
  • 2
  • 请选择