更新一下如何下载官方本地github代码并在本地进行调用,更新的比较晚,截止发布前已经有28.1k的star了。接下来教大家如何分割一切!

 

首先我们可以下载SAM在官方的代码链接:https://github.com/facebookresearch/segment-anything

下载好之后需要配置一下SAM需要的环境,用pycharm打开配置虚拟环境,基本上还是比较基础的库的,下载安装好即可,如何有不会安装的可以评论或者csdn里面搜一下看看

pip install git+https://github.com/facebookresearch/segment-anything.git

主要给大家介绍讲解一下如何在本地批量用SAM模型进行分割,如果光在demo上一张一张upload效率实在太慢,也不知道在自己数据集上效果如何,可以批量生成然后看看。

首先,我们需要下载官方给的权重pth下载链接,我下的是VIT-H的链接,大家可以直接点该下载链接进行下载,其他权重文件可以在给的readme.md上的链接下载。如果需要国内下载的话也可以评论留言我可以上传到百度网盘大家进行下载。

下载好权重文件之后,我们就开始配置并调用SAM,主要的文件其实就在amg.py上面进行配置运行即可,其他文件大家有兴趣的可以仔细阅读一下了解了解。

我们下好相应的权重文件后,记得在amg.py的文件里也配置好相应的配置文件,下面我把我在本地运行成功的配置数据和相应结果放在下面,大家可以参考一下。

主要我们就需要一个input文件,放入我们需要分割的文件路径,最好是jpg,png格式的,可以看官方支持什么格式,还有一个output文件路径,放入我们结果生成的文件。model-type就是刚才说的权重文件的类型,我下的是vit-h所以选的是这个,大家下的什么类型填什么类型即可。checkpoint就是权重文件路径,刚才下载的文件,把路径放进去即可。


parser.add_argument(
    "--input",
    type=str,
    required=False,
    default=r'D:\DATA\AllData\QAdata\JPEGImages',
    help="Path to either a single input image or folder of images.",
)

parser.add_argument(
    "--output",
    type=str,
    required=False,
    default=r'D:\DATA\AllData\QAdata\JPEGImages\result',
    help=(
        "Path to the directory where masks will be output. Output will be either a folder "
        "of PNGs per image or a single json with COCO-style masks."
    ),
)

parser.add_argument(
    "--model-type",
    type=str,
    required=False,
    default='vit_h',
    help="The type of model to load, in ['default', 'vit_h', 'vit_l', 'vit_b']",
)

parser.add_argument(
    "--checkpoint",
    type=str,
    required=False,
    default=r'D:\PROJECT\SAM\segment-anything-main\sam_vit_h_4b8939.pth',
    help="The path to the SAM checkpoint to use for mask generation.",
)

需要提醒一下的是,官方给的readme.md文件上是下图用命令行运行的,在命令行内必须输入default值,但是可以在文件上把required改成False就不用强制输入了,像上图代码所示。

python scripts/export_onnx_model.py --checkpoint <path/to/checkpoint> --model-type <model_type> --output <path/to/output>

配置好之后直接运行amg.py代码即可批量进行分割,很简单是不是!运行成功之后会用一个done!的提示,大家现在可以去分割一切了!

 如果需要进一步了解代码,大家可以打断点看看如何实现分割的,目前官方代码还在更新阶段,具体模型实现结构等还没开源,相当于一个黑盒,大家只能调用,后续如果需要的话也会更新不同功能下的SAM,这个相当于demo中的分割everything。大家有什么不会的可以在底下评论留言,看到我就会回复,喜欢了关注一下点个赞收藏都可以~

Logo

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士,涵盖了多个领域,包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动,为开发者提供更多的学习和交流机会。

更多推荐