logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

0.25B参数量碾压8B模型!NanoTabVLM:轻量级多模态模型的表格转换革命

NanoTabVLM是一款仅0.25B参数的多模态模型,专精于图片表格转HTML任务,性能超越8B大模型7倍以上。其优势包括:1)极致轻量化,普通设备可运行;2)专为复杂表格优化;3)支持中英多语言。采用SigLip2视觉编码器+NanoTabLLM架构,通过双重训练实现高精度。3分钟即可部署,适用于办公自动化、数据录入等场景,重新定义了表格数字化流程。该项目证明小模型在垂直领域同样能创造巨大价值

文章图片
#github#计算机视觉#人工智能
Tailor:视频编辑的魔法工具,免费又强大!

Tailor(中文简称:泰勒)是一款视频智能裁剪、视频生成和视频优化的工具。目前该项目包括了视频剪辑、视频生成和视频优化3大类视频处理方向,共10种方法。Tailor使用方法简单,点点鼠标即可使用最先进的人工智能进行视频处理工作,省时省力,若使用安装版本Tailor,所有的环境配置都可省掉,对用户特别友好。

文章图片
#音视频#github#python +1
到底了