Strona główna » Ai e-book o sztucznej inteligencji » YOLOv9 poprawniejsze w rozpoznawaniu obiektów

YOLOv9 poprawniejsze w rozpoznawaniu obiektów

by kapdes
YOLOv9

YOLOv9 wyznacza nowy standard rozpoznawania obiektów w czasie rzeczywistym.

Oferuje większą dokładność przy mniejszej liczbie obliczeń niż poprzednie modele. YOLO, skrót od „You Only Look Once”, to sztuczna inteligencja do analizy obrazu o otwartym kodzie źródłowym, która rozpoznaje obiekty w czasie rzeczywistym. Oprogramowanie umożliwia maszynom „widzenie” jak ludzie i identyfikowanie szerokiej gamy obiektów na obrazach.

YOLO jest bardzo dokładne i działa na standardowym sprzęcie komputerowym. Obsługuje funkcje takie jak rozpoznawanie obiektów, segmentacja instancji i klasyfikacja obrazów.

YOLOv9 robi więcej za mniej

YOLOv9 oferuje dwie nowe techniki: Programmable Gradient Information (PGI) i Generalized Efficient Layer Aggregation Network (GELAN). PGI poprawia aktualizację sieci w celu dokładniejszego rozpoznawania obiektów, podczas gdy GELAN optymalizuje architekturę sieci w celu zwiększenia dokładności i szybkości.

ebook

Jak Wykorzystać Sztuczną Inteligencję W Życiu Codziennym?

W porównaniu do YOLOv8, YOLOv9 zmniejsza liczbę parametrów o 49 procent i złożoność obliczeniową o 43 procent, jednocześnie zwiększając średnią dokładność (AP) w zbiorze danych MS COCO o 0,6 procent. Obejrzyj poniższy film, aby zobaczyć, jak YOLOv9 wypada w porównaniu ze starszymi modelami YOLO.

Według twórców elastyczność architektury GELAN i wydajność PGI umożliwiają dostosowanie modeli do wymagań systemów wnioskowania bez uszczerbku dla wydajności.

Chociaż YOLOv9 został opracowany specjalnie do rozpoznawania obiektów, można go również dostosować do innych zadań widzenia maszynowego poprzez ulepszenia w architekturze sieci i procesie uczenia.

Twórcy YOLOv9, Chien-Yao Wang, I-Hau Yeh i Hong-Yuan Mark Liao, opublikowali kod źródłowy w serwisie GitHub. Instrukcje dotyczące dostosowania YOLOv9 do własnych danych są dostępne tutaj.

Pozostałe artykuły