马依拉木•木斯得克, 高雨欣, 张思拓, 冯珂, 阿布都克力木•阿布力孜, 哈里旦木•阿布都克里木
录用日期: 2025-04-08
随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,“分割一切模型”(Segment Anything Model, SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计算效率以及在不同应用场景中的适应性等方面,仍然存在一定的优化空间。为此,文中从多个维度对SAM的改进方向进行了深入探索,包括提升速度和计算效率、增强模型的精度与鲁棒性、提高模型的适应性与通用性、优化提示工程设计,以及提升数据利用效率和强化迁移学习能力等方面。通过这些改进,SAM不仅能够在更复杂的任务中保持高效性能,还能更好地适应各领域和应用场景的需求。在此基础上,总结SAM在医学、遥感、机械等多个领域中的实际应用,展示了其在不同场景下的适用性与挑战。此外,文中还详细介绍了图像分割领域常用的数据集和评价指标,通过实验对比分析,进一步评估了Vision Transformer变体对SAM性能的影响,以及Efficient SAM、EfficientViT-SAM、MobileSAM和Robust SAM等改进模型的性能表现。最后,总结了SAM及其改进模型在实际应用中面临的挑战,并展望了未来的发展方向,旨在帮助科研工作者更全面地了解SAM及其变体的改进与应用,为新模型的提出提供启发。