在日常开发、团队协作甚至个人学习中,高效的文件管理智能文档处理常常是提升工作流的关键。 VA-File 是一个由 Java 为核心、结合 Python 智能模块的开源项目,旨在为内网环境提供灵活、可扩展的分布式文件管理解决方案

📌 项目概述

  • 主要语言:Java 8 + Python 3

  • 架构特点:核心模块(VAF-CORE)+ 智能模块(VAF-MIND0/1/2)分布式协作

  • 适用环境:内网文件管理,支持外网端口映射

  • 开源初衷:提供可定制化的文件检索、在线预览、OCR 与格式转换能力,方便开发者二次开发和扩展

🔑 核心功能

  1. 文件与文件夹管理:层级化展示、创建、删除、重命名

  2. 多模式检索

    • 快速模式(主题预索引 + NLP)

    • 深度模式(逐文件内容匹配)

    • 文件名模式(快速匹配文件/文件夹名)

  3. 文档在线查看:浏览器直接预览文本、PDF、图片

  4. 格式转换:Word ↔ PDF 等常见文档格式互转

  5. OCR 识别与摘要:图像转文字,文档自动生成摘要

  6. 内部通信与文件分享:HTTP/Socket 支持,链接分享可控有效期

  7. NLP 文档问答系统:基于 HuggingFace 模型进行语义检索与问答

🏗 技术栈

后端(Java)

  • Spring Boot、MyBatis Plus、Sa-Token、Hutool、POI、WebSocket

后端(Python)

  • FastAPI、TensorFlow、HuggingFace Transformers、Tesseract-OCR、Docx2pdf、Pdf2docx

数据库与缓存

  • MySQL、Redis

前端

  • Vue 3、Element Plus、Axios、Vue Router、Vuex

⚙️ 部署与运行

  1. 启动 Redis、MySQL 并导入数据库结构

  2. 启动 Java 后端(VAF-CORE),配置数据库信息

  3. 启动 Python 模块(VAF-MIND0/1/2)

  4. 启动 Vue 前端,访问 http://localhost:8080

模块可按需启动,不影响基础文件管理功能

🌱 社区与贡献

作为一个开源项目,VA-File 欢迎:

  • 提交 PR 以优化检索、性能和前端体验

  • 新增文件类型支持或第三方存储接入

  • 提出在企业、学校、研究机构等场景中的改进建议

项目目标是成为易用、可扩展、跨平台的文件管理工具,让更多人能够快速搭建适合自己需求的解决方案。

📂 关键字收录:文件管理系统、Java 文件管理、分布式文件检索、开源 OCR 系统、文档在线预览、NLP 文档问答、格式转换工具

开源地址: tyza66/VA-File: VA-文件管理https://github.com/tyza66/VA-File

Logo

惟楚有才,于斯为盛。欢迎来到长沙!!! 茶颜悦色、臭豆腐、CSDN和你一个都不能少~

更多推荐