2024年,目前的开源视觉大模型有哪些?
2024-02-17 阅读 10
2024年目前的开源视觉大模型包括:
1. YOLO (You Only Look Once):一种实时目标检测算法,其最新版本为YOLOv5。
2. EfficientDet:由谷歌研发的高效目标检测模型,具有高精度和高效率的特点。
3. MMDetection:一个基于PyTorch的开源目标检测工具包,支持多种主流的目标检测模型,如Faster R-CNN、Mask R-CNN等。
4. Detectron2:Facebook开源的目标检测和实例分割工具包,具有高灵活性和可扩展性。
5. OpenMMLab:一个基于PyTorch的开源多媒体深度学习工具包,包含多个视觉模型,如MMClassification、MMDetection等。
这些开源视觉大模型在目标检测、实例分割等领域都有广泛的应用,并且在不断更新和优化中。
更新于 2024年11月20日