Dlaczego obraz na brzegu? Kontekst przemysłowy i decyzja „chmura vs edge”
Scena z hali: decyzja w milisekundach, brak internetu
Wyobraź sobie linię pakowania. Taśma idzie szybko, ponad kilkadziesiąt produktów na minutę. Nad taśmą kamera, obok robot odrzucający wadliwe sztuki. Nagle na linii pojawia się partia z błędnym nadrukiem daty ważności. System ma ułamki sekundy, żeby wykryć błąd i „kopnąć” dany produkt z taśmy. W tym samym czasie łącze do internetu przysiada, bo ktoś w biurze przesyła ciężkie pliki CAD do centrali.
Jeśli analiza obrazu dzieje się w chmurze, każdy kadr musi polecieć gdzieś do centrum danych, zostać przetworzony i wrócić z decyzją. Przy idealnych warunkach może się to udać. W realnym zakładzie – z zakłóceniami, czasem z całkowitym brakiem dostępu do sieci zewnętrznej – to przepis na pomyłki i przestoje. Dlatego coraz więcej fabryk „ściąga” sztuczną inteligencję z chmury na dół, bezpośrednio do szafy sterowniczej lub nawet do samej kamery. To właśnie Edge AI w przemyśle.
Ograniczenia rozwiązań chmurowych w zakładach produkcyjnych
Chmura ma swoje miejsce, ale w kontekście analizy obrazu na brzegu sieci pojawia się kilka twardych ograniczeń:
- Opóźnienia (latencja) – przesył obrazu do chmury, przetwarzanie, odpowiedź. Nawet przy światłowodzie i wydajnej infrastrukturze, opóźnienia liczony w dziesiątkach milisekund mogą być za duże dla szybkiej linii.
- Stabilność łącza – zakłady często działają na wydzielonych, zamkniętych sieciach. Dostęp do internetu bywa limitowany z powodów bezpieczeństwa. Każde przerwanie łącza wprost przekłada się na brak decyzji z systemu wizyjnego.
- Transfer danych – strumień z kilku kamer w wysokiej rozdzielczości to ogromne ilości danych. Koszt stałego wysyłania ich do chmury bywa wysoki, a czasem po prostu nie do przepchnięcia przez istniejącą infrastrukturę.
- Regulacje i poufność – w wielu branżach (farmacja, automotive, obronność) bezpieczeństwo danych w Edge AI jest kluczowe. Wysyłanie obrazów produktów, części, a tym bardziej ludzi poza zakład budzi opór działów compliance i IT.
- Przestoje planowane i nieplanowane – aktualizacje, prace konserwacyjne, awarie po stronie dostawcy chmury. Linia produkcyjna nie może „czekać”, aż komuś w data center wróci zasilanie.
W klasycznym biurowym zastosowaniu chmury kilkusekundowa przerwa to irytacja. Na produkcji – możliwy koszt liczony w dziesiątkach tysięcy, bo stanęła linia lub wypuściła wadliwą partię.
Dlaczego fabryki przenoszą AI „na dół” – kluczowe motywacje
Decyzja o wdrożeniu systemów wizyjnych bez chmury ma kilka powtarzających się przyczyn:
1. Czas reakcji – inferencja na urządzeniach edge dzieje się lokalnie, więc opóźnienia są przewidywalne i niewielkie. To różnica między zatrzymaniem prasy przed wciągnięciem rękawicy pracownika a odnotowaniem wypadku po fakcie.
2. Koszty łącza i infrastruktury – zamiast pompować surowy obraz do chmury, urządzenie edge wysyła tylko wyniki (np. liczba wadliwych sztuk, statystyki, alarmy). Przepustowość spada dramatycznie, a z nią rachunki za łącze i wymagania dla sieci.
3. Kontrola nad danymi – dane nie opuszczają zakładu, co upraszcza temat RODO, NDA z klientami, audyty bezpieczeństwa. Łatwiej też negocjować z dostawcami, bo wiedza o procesie produkcyjnym nie ląduje w cudzej chmurze.
4. Niezależność od jednego dostawcy – przy architekturze edge-only zakład może sam decydować, jakiego frameworka użyje, kogo zaprosi do utrzymania modeli, a nawet wymienić dostawcę chmury bez ruszania infrastruktury na hali.
Typowe zastosowania Edge AI w produkcji
W praktyce edge AI w produkcji skupia się dziś przede wszystkim na obrazie. Najczęstsze scenariusze to:
- Kontrola jakości – wykrywanie rys, braków, zanieczyszczeń, nieprawidłowego montażu, uszkodzeń opakowań.
- Bezpieczeństwo pracowników – detekcja obecności ludzi w strefach niebezpiecznych, brak środków ochrony osobistej (hełm, kamizelka), zbyt mały dystans od robota.
- Śledzenie produktów – rozpoznawanie palet i kontenerów, sprawdzanie poprawności etykiet, odczyt kodów kreskowych, kodów 2D i znaków (OCR) w trudnych warunkach.
- Monitoring procesów – obserwacja płomienia, łuku spawalniczego, poziomu napełnienia, obecności piany, kolorystyki materiału przy zmianach receptury.
W wielu z tych przypadków wysyłanie pełnego obrazu do chmury nic nie daje. Wystarczy lokalnie stwierdzić: „OK / NOK”, „człowiek w strefie / brak człowieka”, „kod czytelny / nieczytelny” i przekazać wynik dalej do PLC czy systemu MES.
Kiedy chmura ma sens, a kiedy lepiej postawić na edge
Edge AI i chmura nie są wzajemnie wykluczające. Dobrze się uzupełniają, ale pełnią różne role. Kilka prostych kryteriów decyzyjnych:
- Czas reakcji: jeśli decyzja ma zapaść w czasie krótszym niż, powiedzmy, 100 ms – celuj w edge-only lub „edge + agregacja do chmury”.
- Wolumen danych: jeśli masz kilka kamer HD, które pracują 24/7, systemy wizyjne bez chmury będą znacznie tańsze w eksploatacji niż stały strumień do internetu.
- Wymogi regulacyjne i bezpieczeństwa: przy wrażliwych procesach lub danych osobowych ludzi na hali, analiza obrazu na brzegu sieci pozwala nie wysyłać twarzy, sylwetek czy layoutu hali na zewnątrz.
- Tryb pracy zakładu: jeśli zakład bywa odcinany od internetu, chmura jest dodatkiem, nie fundamentem. Modele muszą działać w pełni lokalnie.
- Potrzeba analizy historycznej: do analiz długoterminowych – trendów, retrainingu modeli, raportowania do centrali – chmura świetnie się nadaje, ale pracuje na zredukowanych, zanonimizowanych danych, a nie na surowym obrazie.
Rozsądny kompromis to często: decyzje w czasie rzeczywistym na brzegu, a agregacja, trenowanie i raportowanie w chmurze – z kontrolą nad tym, co faktycznie opuszcza zakład.
Co właściwie robi Edge AI? Krótkie podstawy bez gadżeciarskiego żargonu
Co to jest „brzeg” w praktyce zakładowej
Słowo „edge” brzmi marketingowo, ale w halowej rzeczywistości oznacza po prostu urządzenia jak najbliżej procesu. Może to być:
- Mikrokontroler lub mały moduł w obudowie IP65 przy maszynie, który obsługuje jedną kamerę.
- Przemysłowy PC (IPC) w szafie sterowniczej, który obsługuje kilka stanowisk wizyjnych.
- Serwer w korytarzu produkcyjnym, który zbiera strumienie z wielu linii, ale nadal stoi fizycznie w zakładzie.
Kryterium jest jedno: inferencja na urządzeniach edge odbywa się lokalnie, bez konieczności pytania chmury o zdanie. Nawet jeśli urządzenie ma dostęp do internetu, to jest on opcjonalny, a nie krytyczny dla pracy produkcji.
Prosta analityka vs „prawdziwe” Edge AI
Od lat istnieją kamery przemysłowe z prostą analityką: wykrywanie krawędzi, porównanie z wzorcem, proste pomiary. To niekoniecznie jest jeszcze Edge AI. Różnica polega na tym, że:
- prosta analityka opiera się na twardo zakodowanych regułach (np. „jeśli piksel ma jasność poniżej X, to uznaj to za defekt”),
- Edge AI wykorzystuje modele uczenia maszynowego lub głębokiego, które zostały wytrenowane na przykładach i potrafią uogólniać wiedzę na nowe przypadki.
Praktyczna różnica? Klasyczne systemy wizyjne świetnie radzą sobie tam, gdzie produkt i warunki są bardzo powtarzalne. Edge AI pomaga w sytuacjach „miękkich”: różne typy defektów, zmienne oświetlenie, nowe warianty produktu. Nie trzeba programować każdego przypadku osobno – model sam „uczy się” rozpoznawać wzorce.
Typowy przepływ w Edge AI: od kamery do decyzji
Edge AI w przemyśle to nie magia. W uproszczeniu każdy cykl wygląda tak:
- Przechwycenie obrazu – kamera robi zdjęcie lub przechwytuje klatkę wideo w odpowiednim momencie (np. na sygnał z enkodera taśmy lub PLC).
- Wstępne przetwarzanie – urządzenie edge kadruje obraz, skaluje do rozdzielczości wymaganej przez model, normalizuje kolory, czasem usuwa szum.
- Inferencja modelu – obraz trafia do modelu, który zwraca np. klasy (OK/NOK), lokalizacje defektów (bounding boxy), maski segmentacji lub odczytany tekst/OCR.
- Decyzja i akcja – na podstawie wyniku system generuje sygnał do PLC, zapisuje informację w bazie danych, wyświetla alarm wizualny lub aktywuje siłownik, który zrzuca wadliwy produkt do zrzutni.
Cały ten łańcuch może trwać dziesiątki milisekund, o ile model jest dobrze zoptymalizowany, a urządzenie edge odpowiednio dobrane. O tym, jak to osiągnąć, decyduje m.in. optymalizacja modeli pod edge – redukcja rozmiaru, kwantyzacja, użycie akceleratorów.
Ograniczenia środowiska edge: z czym trzeba się liczyć
Na serwerach w chmurze można użyć potężnych GPU, setek gigabajtów RAM i nie martwić się o temperaturę. Na brzegu jest zupełnie inaczej:
- Moc obliczeniowa – małe SoC lub IPC mają znacznie mniej „pary” niż serwer. Model musi być lżejszy, a kod – zoptymalizowany.
- Pamięć RAM i pamięć masowa – ograniczona ilość pamięci wymusza mniejsze batch size, ostrożne logowanie i zwięzłe przechowywanie danych.
- Energia – urządzenia edge w szafkach, na ruchomych elementach czy w pojazdach AGV często działają z ograniczonym budżetem energetycznym. Każdy wat się liczy.
- Temperatura i wibracje – wysoka temperatura, pył, wibracje maszyn – to codzienność. Sprzęt i chłodzenie muszą to wytrzymać, inaczej modele zaczną „chrupać” w najbardziej krytycznych momentach.
- Brak stałego internetu – aktualizacje, monitoring i zdalny dostęp trzeba zaplanować tak, aby system działał poprawnie nawet przy wielodniowym braku połączenia z zewnętrznym światem.
Z tego powodu edge AI w produkcji wymaga innego myślenia niż typowe projekty data science. Tu liczy się nie tylko dokładność modelu, ale także jego stabilność i przewidywalność w trudnych warunkach.
Analogią: „mądry aparat” kontra przemysłowa kamera z Edge AI
Dobrym porównaniem jest współczesny smartfon. Gdy robisz zdjęcie, telefon w locie rozpoznaje twarz, dopasowuje ekspozycję, a czasem nawet usuwa szum i poprawia kolory. To też jest Edge AI – model działa w samym urządzeniu.
Różnica w przemyśle polega na tym, że:
- „Mądry aparat” ma za zadanie poprawić wrażenia użytkownika – jak zdjęcie wygląda.
- Kamera przemysłowa z Edge AI ma za zadanie podjąć twardą decyzję – zatrzymać linię, odrzucić element, uruchomić alarm. Tu nie ma miejsca na „ładniejsze fotki”, liczy się powtarzalność i możliwość audytu decyzji.
Edge AI w fabryce jest więc bliżej automatyki niż gadżetów. To cyfrowy operator, który widzi, rozumie i reaguje, ale zawsze w określonych ramach bezpieczeństwa i jakości.

Typowe scenariusze użycia w fabryce – od kontroli jakości po bezpieczeństwo
Kontrola jakości wizualnej z użyciem Edge AI
Najczęstszy przypadek użycia to monitorowanie jakości wizyjnej. Klasyczne systemy wizyjne z regułami sprawdzają m.in. obecność elementu, kolor, wymiary. Edge AI idzie krok dalej i „patrzy” na całość produktu jak człowiek na stole inspekcyjnym.
Przykładowe zadania:
- Wykrywanie defektów powierzchni – rysy, wżery, przebarwienia, zabrudzenia na elementach metalowych, plastikowych czy lakierowanych.
Inne zastosowania na linii: kompletność, montaż, etykiety
Obok gołych defektów powierzchniowych pojawia się cała gama zadań, które dla człowieka są „na oko oczywiste”, a dla klasycznych systemów wizyjnych – już niekoniecznie. Edge AI dobrze radzi sobie z przypadkami, gdzie produkt ma wiele wariantów, a kombinacji jest zbyt dużo, aby każdą opisać regułami.
- Kontrola kompletności montażu – sprawdzanie, czy wszystkie śrubki, złączki, uszczelki i przewody są na swoim miejscu, nawet jeśli występują w kilku dopuszczalnych wariantach ułożenia.
- Weryfikacja poprawnego złożenia – czy element A jest wpięty w gniazdo B, czy dźwignia jest w pozycji „zamknięte” i czy klips faktycznie zatrzasnął się, a nie „prawie wszedł”.
- Spójność etykiet i nadruków – sprawdzenie, czy nadrukowany kod partii zgadza się z etykietą, czy logo jest poprawne dla danej specyfikacji, czy nie pomieszano wersji językowych.
- OCR i weryfikacja kodów – odczyt małych, słabo kontrastowych oznaczeń laserowych, dat ważności na zakrzywionych powierzchniach, mikroskopijnych numerów seryjnych.
W praktyce wygląda to tak: kamera widzi produkt z kilku perspektyw, a model nie tylko klasyfikuje „OK/NOK”, ale też potrafi wskazać, dlaczego jest NOK – np. podświetla obszar z brakującą śrubą. To bardzo pomaga utrzymaniu ruchu przy analizie przyczyn problemu.
Monitorowanie procesów ciągłych
Na liniach procesowych – walcownie, linie malarskie, wytłaczarki, linie pakujące – obraz zmienia się w sposób ciągły. Człowiek mógłby stać i patrzeć godzinami, ale po kwadransie uwagi już nie ma. Edge AI nie męczy się i może analizować każdy fragment.
Typowe przykłady to:
- Wizualna kontrola taśm i folii – wykrywanie rozdarć, zagnieceń, pofałdowań, nieregularnych smug farby lub kleju.
- Śledzenie poziomu napełnienia – ocena, czy butelki lub pojemniki są napełnione w akceptowalnym przedziale, jeszcze przed wagą kontrolną.
- Monitorowanie płomienia i stref nagrzewania – analizowanie kształtu i barwy płomienia, żarzenia się elementów, aby szybko wychwycić odchyłki procesu.
Tu często nie ma jednej „złotej reguły”. Model analizuje sekwencję obrazów i reaguje, gdy widzi rzeczy, których nie nauczył się jako typowe – np. powtarzające się fałdy na folii albo nietypową strukturę powierzchni.
Bezpieczeństwo i ergonomia stanowisk pracy
Drugim wielkim obszarem zastosowania jest bezpieczeństwo ludzi. Nie chodzi o zastąpienie klasycznych kurtyn bezpieczeństwa, ale o ich uzupełnienie – tam, gdzie prosta bariera „ON/OFF” to za mało.
Przykładowe scenariusze:
- Wykrywanie obecności ludzi w strefach niebezpiecznych – modele rozpoznają sylwetki, hełmy, kamizelki, pozycję ciała. Jeśli ktoś wejdzie w obszar, gdzie nie powinno być ruchu pieszego, system zwalnia lub zatrzymuje maszynę.
- Kontrola użycia ŚOI – sprawdzenie, czy operator ma kask, okulary ochronne, kamizelkę odblaskową lub rękawice, zanim brama dopuści go do pracy przy danej strefie.
- Analiza zachowań ergonomicznych – ocena, czy pracownicy często pochylają się w sposób grożący kontuzją, czy zbyt długo wykonują ruchy skrętne. To już bardziej zaawansowane projekty, ale umożliwiają prewencję urazów.
Tu szczególnie ważne jest, że analiza odbywa się lokalnie, a poza zakład nie wychodzi obraz z twarzami ani dokładne nagrania. Do chmury można wysyłać tylko statystyki: ile razy w tygodniu naruszono strefę, ile wejść do maszyny było niezgodnych z procedurą.
Śledzenie przepływu materiału i logistyka wewnętrzna
Kolejna grupa zastosowań to obszar magazynów, gniazd logistycznych, AGV/AMR oraz doków załadunkowych. Zamiast ręcznego liczenia palet czy sprawdzania numerów na kartonach, system wizyjny z Edge AI może śledzić ruch towaru niemal w tle.
- Automatyczne odczytywanie etykiet logistycznych – OCR, kody 2D, kody kreskowe w różnych położeniach i przy słabym oświetleniu.
- Wykrywanie nieprawidłowego ułożenia palet – rozpoznanie, czy paleta nie jest przechylona, czy stos nie przekracza dopuszczalnej wysokości, czy nie wystają pojedyncze kartony.
- Wspomaganie nawigacji pojazdów autonomicznych – dodatkowa warstwa bezpieczeństwa: wykrywanie nagłych przeszkód, ludzi, wózków, nieoczekiwanych przesyłek na trasie robota.
Ciekawa różnica wobec zastosowań jakościowych jest taka, że tutaj często bardziej liczy się ciągła obserwacja niż superprecyzyjna klasyfikacja. Model nie musi wiedzieć, jaki to dokładnie typ palety – ważne, że rozróżnia „bezpiecznie / niebezpiecznie”.
Predykcja awarii na podstawie obrazu
Edge AI potrafi też patrzeć nie na produkt, ale na samą maszynę. Kamery termowizyjne wykrywają przegrzewające się łożyska czy szafy sterownicze, a klasyczne kamery – nieprawidłowe wibracje lub luzujące się elementy.
Stosuje się m.in.:
- Monitorowanie termiczne – analiza map ciepła silników, napędów, złączy, które na co dzień działają poprawnie, ale przy zbliżającej się awarii „świecą” mocniej w kamerze IR.
- Wizualne wykrywanie nieszczelności – krople oleju, mgła smarowa, parowanie, nietypowe zabrudzenia w okolicach uszczelnień.
- Analiza drgań z obrazu – „oglądanie” drobnych przesunięć lub drgań elementów, które mogą świadczyć o poluzowanych śrubach, zużytych amortyzatorach czy niewyważeniu.
Zaletą takich rozwiązań jest to, że można je wdrożyć bez ingerencji w istniejące czujniki – kamera patrzy z zewnątrz, a Edge AI pełni rolę czujnika „multi-purpose”, który da się łatwo przeuczyć na nowe zjawiska.
Architektura rozwiązania Edge AI do analizy obrazu – od kamery do PLC
Warstwa akwizycji: kamery i wyzwalanie
Na samym dole architektury jest obraz. To, jak zostanie przechwycony, w dużej mierze decyduje o sukcesie projektu. W praktyce spotyka się trzy główne scenariusze:
- Kamery „smart” z własnym procesorem – część logiki Edge AI siedzi już w kamerze; do IPC idzie tylko wynik lub wycinek obrazu.
- Klasyczne kamery przemysłowe (GigE, USB3, CoaXPress) – pełny obraz trafia do komputera edge, gdzie dalej jest przetwarzany.
- Kamery IP / systemy CCTV – w zastosowaniach bezpieczeństwa wykorzystuje się istniejące kamery, a Edge AI „podsłuchuje” strumień RTSP.
Do tego dochodzi kwestia wyzwalania: nie ma sensu liczyć każdej klatki z 60 FPS, jeśli produkt pojawia się raz na sekundę. Wyzwalanie zdjęcia robi się zwykle z:
- sygnału z enkodera (pozycja na taśmie),
- wejścia z czujnika optycznego lub indukcyjnego,
- sygnału z PLC po osiągnięciu konkretnego kroku programu.
Dobrze zestrojone wyzwalanie zmniejsza obciążenie obliczeniowe i upraszcza logikę, bo każda klatka ma ustandaryzowaną pozycję produktu.
Warstwa edge compute: gdzie chodzi model
Powyżej kamer znajduje się urządzenie, na którym faktycznie uruchamiany jest model. Zakres możliwości jest szeroki – od małych modułów SoC po serwer GPU w szafie.
Często stosuje się podejście warstwowe:
- Bezpośrednio przy linii – mały komputer lub moduł AI (np. z ARM + NPU), który przyjmuje obraz z 1–2 kamer i wykonuje krytyczne inferencje w czasie rzeczywistym.
- Na poziomie gniazda/sekcji linii – przemysłowy PC zbierający dane z kilku stanowisk, wykonujący cięższe modele lub zadania agregacji.
- Lokalne „edge data center” – szafa z kilkoma serwerami, która może trenować lub dostrajać modele na danych z całej hali, ale nadal stoi w zakładzie.
Wybór architektury zależy od tego, jak bardzo krytyczny jest czas reakcji i jak duża jest redundancja. Czasem bardziej opłaca się mieć kilka prostszych, niezależnych urządzeń przy każdej maszynie niż jeden „mózg” obsługujący wszystko.
Ścieżka danych: od surowego obrazu do wyniku
W działającej instalacji przepływ danych można rozrysować jako kilka logicznych bloków:
- Capture – pobranie klatki lub serii klatek z kamery wraz z timestampem i ID produktu/partii.
- Preprocessing – kadrowanie, korekta perspektywy, skalowanie, korekta jasności/kontrastu, ewentualne filtrowanie szumu.
- Inference – wywołanie modelu (np. detekcja obiektów, segmentacja, klasyfikacja) na przygotowanym tensorze.
- Postprocessing – przeliczenie wyników na kategorie decyzyjne, np. „OK/NOK z przyczyną X”, obliczenie wskaźników, progowanie po confidence score.
- Integracja z automatyką i IT – wygenerowanie sygnałów, zapis do bazy, wysłanie do MES/SCADA.
Te bloki często zamyka się w osobnych modułach oprogramowania, co pozwala np. wymienić sam model bez ruszania całej logiki sterowania albo dołożyć dodatkowe przetwarzanie wstępne, gdy zmienią się kamery.
Komunikacja z PLC i systemami nadrzędnymi
Najlepszy model nic nie da, jeśli nie potrafi „dogadać się” z istniejącymi sterownikami. W przemysłowej rzeczywistości trzeba wpasować się w standardy i przyzwyczajenia działu automatyki.
Do komunikacji wykorzystuje się najczęściej:
- Wejścia/wyjścia dyskretne – najprostsza forma: kanał sygnałowy „OK/NOK”, sygnał gotowości, ewentualnie kilka linii binarnych kodujących typ błędu.
- Protokoły przemysłowe – Profinet, EtherNet/IP, Modbus TCP, OPC UA; tu urządzenie edge występuje jako węzeł sieci, a PLC odczytuje dane jak z innego sterownika.
- Interfejsy IT – REST API, MQTT, gRPC do komunikacji z systemami MES, WMS czy platformami IIoT.
Często tworzy się warstwę „adaptera” – mały moduł oprogramowania, który tłumaczy wyniki modelu na język zrozumiały dla PLC. Dzięki temu zmiana modelu lub dodanie kolejnego scenariusza wizji nie wymaga przepisywania programu sterownika.
Zarządzanie modelami i aktualizacjami na brzegu
Drugi, mniej widoczny kawałek architektury to lifecycle modeli. Na serwerach w chmurze to naturalne – ale jak zapanować nad kilkudziesięcioma urządzeniami rozsianymi po hali?
Typowym podejściem jest:
- utrzymywanie centralnego repozytorium modeli (on-prem lub w chmurze),
- wprowadzenie wersjonowania (Model v1.3, v1.4 z inną logiką postprocessingu),
- ustalenie procedury „rollout & rollback” – jak wypuszczać nową wersję na kilku wybranych stanowiskach testowych i szybko wrócić do poprzedniej, jeśli coś pójdzie nie tak.
Urządzenia edge łączą się okresowo z serwerem zarządzającym (gdy jest dostęp do sieci), pobierają nowe wersje, zapisują je obok starych i dopiero po pozytywnym teście przełączają się na nową. To trochę jak OTA w automotive: aktualizacje są, ale w kontrolowany sposób, z możliwością cofnięcia.
Monitorowanie i logowanie na brzegu
Żeby system był utrzymywalny, musi dawać wgląd w swoją pracę. Nie chodzi o trzymanie gigabajtów obrazu, tylko o sprytne logowanie.
Najczęściej stosuje się:
- logi operacyjne – czasy inferencji, użycie CPU/GPU, liczba błędów sprzętowych, restartów, timeoutów komunikacji,
- logi decyzyjne – procent NOK, typy błędów, rozkład po zmianach, seriach, recepturach,
- bufor przykładów trudnych przypadków – ograniczony zbiór obrazów, które model sklasyfikował z niską pewnością lub które zostały zakwestionowane przez kontrolę ręczną.
Dobór sprzętu: kamery, komputery edge, akceleratory – co z czym gra
Jak zacząć: od procesu, nie od katalogu
Dobór sprzętu do Edge AI przypomina wybór narzędzi do warsztatu: można kupić całą ścianę kluczy, ale i tak kluczowy jest konkretny przypadek użycia. Dlatego najpierw definiuje się:
- jak szybko musi zapaść decyzja (milisekundy, sekundy, minuty),
- jak dokładny ma być pomiar lub detekcja,
- w jakich warunkach pracuje stanowisko (temperatura, drgania, zapylenie, mycie CIP),
- ile kamer będzie obsługiwać jedno urządzenie edge.
Dopiero na tym tle wybiera się konkretne kamery, IPC i akceleratory. W przeciwnym razie łatwo skończyć z „armatą do muchy” – serwerem GPU do prostego liczenia obiektów – albo zbyt słabym modułem, który dławi się przy pierwszym bardziej złożonym modelu.
Kamery przemysłowe: matryca, obiektyw, interfejs
Kamery są oczami systemu. Nawet najlepszy model nie poprawi kiepskiego obrazu. Przy wyborze zwykle rozważa się kilka osi:
- Rodzaj matrycy – kamery kolorowe (RGB) przydają się, gdy istotne są odcienie, np. wypieczenie, korozja, obecność etykiety. Kamery monochromatyczne dają lepszą czułość i kontrast przy analizie kształtu czy pęknięć, często w połączeniu z oświetleniem wąskopasmowym.
- Rozdzielczość – nie chodzi o „jak najwięcej megapikseli”, tylko o to, ile pikseli przypada na element, który ma być analizowany. Jeśli rysa ma mieć co najmniej kilka pikseli szerokości, łatwiej ją wykryć.
- Obiektyw – kąt widzenia, głębia ostrości, jasność. Prosty błąd to dobranie świetnej kamery i przypadkowego obiektywu, który „muli” obraz i wprowadza dystorsję.
- Interfejs – GigE Vision do dłuższych dystansów i sieci przemysłowych, USB3 do krótkich odcinków i prostszej integracji, CoaXPress w aplikacjach high-speed z dużym strumieniem danych.
Przy pozycjonowaniu i pomiarach geometrycznych wchodzi jeszcze w grę kalibracja – odwzorowanie pikseli na jednostki fizyczne i kompensacja zniekształceń. Warto przewidzieć ją już na etapie montażu, a nie „doklejać” później w kodzie.
Specjalistyczne typy kamer: IR, 3D, hyperspektralne
Gdy klasyczna kamera nie wystarcza, sięga się po bardziej wyspecjalizowane rozwiązania. Nie są one zarezerwowane dla laboratoriów – coraz częściej stoją przy zwykłej linii pakowania.
- Kamery termowizyjne (IR) – używane do monitorowania przegrzewania, kontroli pieców, zgrzewów foliowych. Tutaj ważna jest stabilność temperaturowa i odpowiedni zakres (np. inne modele do szaf sterowniczych, inne do pieców hartowniczych).
- Kamery 3D / ToF / stereo – pomagają mierzyć objętość, wysokość, kontrolować poprawność ułożenia elementów w przestrzeni. Przydają się, gdy samo 2D nie rozróżni np. „dwa elementy sklejone” od jednego grubszego.
- Kamery liniowe – stosowane przy bardzo szybkich taśmach lub nawijaniu materiałów (folie, tekstylia). Obraz powstaje linia po linii, więc Edge AI pracuje na „pasie” zamiast pełnych klatek.
- Kamery hyperspektralne – pozwalają patrzeć na skład materiału, nie tylko na kolor. Używane głównie w spożywce, farmacji czy recyklingu – tam, gdzie trzeba odróżnić np. typ plastiku czy wilgotność produktu.
Przy takich kamerach kluczowe jest, aby od początku ustalić, czy model AI będzie pracował na surowych danych, czy na przekształconych kanałach (np. wyliczonych cechach spektralnych). To wpływa na wymagania co do mocy obliczeniowej.
Oświetlenie – cichy bohater systemu
Wizja przemysłowa bez dobrego światła szybko zamienia się w zgadywankę. Edge AI radzi sobie lepiej niż klasyczne reguły, ale wciąż obowiązuje prosta zasada: im stabilniejsze i powtarzalne oświetlenie, tym prostszy model.
Stosuje się głównie:
- Oświetlenie pierścieniowe i panelowe LED – do równomiernego oświetlenia obszaru roboczego.
- Światło kierunkowe – podkreślające rysy, zagięcia, wypukłości dzięki cieniom.
- Światło wąskopasmowe + filtry optyczne – odcinające zakłócenia z otoczenia, np. światło dzienne czy sodowe lampy hali.
- Backlight (podświetlenie od tyłu) – do kontroli kształtu, kompletności, obecności otworów, np. w tłoczkach czy złączach.
Dobrym zwyczajem jest podpięcie oświetlenia pod sterowanie (np. stroboskopowo) zamiast świecenia ciągłego. Zmniejsza to zużycie, nagrzewanie i poprawia powtarzalność ekspozycji.
Komputery edge: IPC, moduły SoC i rugged serwery
Urządzenia obliczeniowe na brzegu muszą jednocześnie policzyć model, wytrzymać warunki pracy i wpasować się w infrastrukturę automatyki. Najczęściej rozważa się trzy kategorie:
- Przemysłowe PC (IPC) – klasyczne komputery w obudowie panelowej lub box PC, często z kartami rozszerzeń (grabbery, I/O). Dają elastyczność, łatwo je serwisować, nadają się do kilku kamer i średnio ciężkich modeli.
- Moduły SoC / komputery jednopłytkowe – kompaktowe rozwiązania z ARM + dedykowaną jednostką NPU lub małym GPU. Idealne do pojedynczych stanowisk, gdzie liczy się pobór mocy, rozmiar i koszt, a model jest dobrze zoptymalizowany.
- Rugged serwery – montowane w szafach, z wydajnymi GPU, przeznaczone do agregacji danych z wielu kamer i uruchamiania kilku modeli jednocześnie. Sprawdzają się, gdy jedna instalacja obsługuje większy fragment procesu.
Na etapie wyboru warto sprawdzić nie tylko liczbę portów czy taktowanie CPU, ale też dostępność wsparcia sterowników dla wybranych akceleratorów i bibliotek (CUDA, OpenVINO, TensorRT, ROCm itp.). Banalny konflikt sterownika z systemem operacyjnym potrafi zatrzymać projekt na tygodnie.
Akceleratory AI: GPU, NPU, FPGA
Samo CPU coraz rzadziej wystarcza. Aby utrzymać sensowny czas inferencji, dokładane są akceleratory. Każdy z nich ma swoją „specjalizację”.
- GPU – najbardziej uniwersalne. Dobrze liczą sieci CNN, obsługują wiele frameworków, łatwo się je profiluje. Minusem jest wyższy pobór mocy i często konieczność chłodzenia aktywnego.
- NPU / akceleratory dedykowane – układy projektowane pod inferencję (np. Edge TPU, różne moduły AI). Bardzo energooszczędne, często montowane bezpośrednio na płycie. Wymagają jednak dopasowania modeli i korzystania z dedykowanych toolchainów.
- FPGA – świetne tam, gdzie liczy się deterministyczne opóźnienie i możliwość przetwarzania strumieniowego „w locie”. Więcej pracy wymaga jednak przygotowanie modelu i pipeline’u pod konkretny projekt FPGA.
Rozsądnym podejściem jest zaczynanie od GPU (łatwiejsze prototypowanie), a dopiero na etapie industrializacji rozważać migrację na NPU lub FPGA, jeśli wymaga tego koszt, pobór mocy albo miejsce w szafie sterowniczej.
Pamięć, dyski i niezawodność
Edge AI często działa 24/7, więc sprzęt musi wytrzymać coś więcej niż testy w laboratorium. Kilka elementów, które często są niedoszacowane:
- Pamięć RAM – modele głębokie + kilka strumieni wideo + buforowanie obrazów do logowania potrafią zaskakująco szybko ją „zjeść”. Lepiej założyć zapas i nie pracować na granicy.
- Dyski SSD klasy przemysłowej – wiele małych zapisów (logi, krótkie serie obrazów) przyspiesza zużycie nośnika. Warto stosować SSD o wyższym TBW i z mechanizmami monitorowania zużycia.
- Odporność mechaniczna – montaż w szafie, amortyzacja, unikanie „wiszących” przewodów i złącz, które luzują się przy drganiach.
- Zasilanie – osobne zabezpieczenie, możliwość restartu zdalnego, filtry przeciwzakłóceniowe. W wielu zakładach to właśnie niestabilne zasilanie powoduje „duchy” w logach.
Dobrą praktyką jest test obciążeniowy przed uruchomieniem produkcyjnym: ciągła inferencja przez kilka dni, logowanie temperatur, restartów, opóźnień. Lepiej wyłapać problemy w testowni niż w poniedziałek o 3:00 na nocnej zmianie.
System operacyjny i środowisko uruchomieniowe
Warstwa software’u blisko sprzętu decyduje o tym, czy aktualizacje bibliotek będą koszmarem, czy rutyną. W zakładach najczęściej spotyka się:
- Linux w wersji LTS – stabilna baza dla bibliotek AI, z kontrolą pakietów, dobrze współgra z konteneryzacją. Daje elastyczność, ale wymaga kompetencji administracyjnych.
- Windows IoT / Windows Embedded – często wybierany tam, gdzie już istnieje duża baza oprogramowania windowsowego i narzędzi wizualizacyjnych. Integracja z niektórymi frameworkami AI jest nieco cięższa, ale dla części zastosowań w zupełności wystarczająca.
Coraz częściej warstwa aplikacyjna (capture, inference, komunikacja z PLC) jest pakowana w kontenery (Docker/Podman) nawet na pojedynczych IPC. Ułatwia to aktualizacje, zapewnia powtarzalne środowisko bibliotek i pozwala szybciej przenieść rozwiązanie na inny sprzęt.
Dobór sprzętu do typu modelu
Nie każdy model jest równie „łasy” na zasoby. W praktyce sprzęt dobiera się pod kilka wymiarów modelu:
- Rozmiar wejścia – detekcja na klatkach 4K wymaga zupełnie innej mocy niż na 640×480. Czasem taniej jest zastosować sprytny preprocessing (crop, downsampling) niż dwukrotnie mocniejszą kartę.
- Typ architektury – lekkie modele (MobileNet, EfficientNet w mniejszych wariantach, YOLO nano/micro) dobrze czują się na NPU i słabszych GPU. Duże modele segmentacji lub multi-task (kilka wyjść) wolą mocniejsze GPU.
- Liczba żądań równoległych – jedno stanowisko z jednym triggerem poradzi sobie na skromnym module. Dziesięć linii równolegle wymaga już planowania kolejkowania lub większej ilości akceleratorów.
W wielu projektach stosuje się dwa warianty tego samego modelu: „lekki” do pracy on-line i „cięższy”, dokładniejszy do off-line’owej analizy trudnych przypadków czy do etapu re-treningu.
Prototyp vs produkcja: kiedy zmienić klasę sprzętu
Typowy scenariusz wygląda tak: na początku testy lecą na laptopie z GPU albo jednym mocnym IPC, potem okazuje się, że rozwiązanie trzeba powielić na kilkanaście linii. To dobry moment, żeby zadać sobie kilka pytań:
- czy naprawdę potrzebna jest ta sama moc obliczeniowa na każdym stanowisku, czy część zadań da się przesunąć na poziom wyżej (agregujący edge server),
- czy model został już zoptymalizowany (pruning, quantization, kompilacja do silnika inferencyjnego),
- czy wybrany sprzęt ma „głowę do góry” na ewolucję procesu (np. dodatkową kamerę, nowy typ produktu).
W jednej z fabryk opakowań kartonowych zaczęto od serwera GPU obsługującego całą halę. Po pół roku, gdy proces dojrzał, podzielono system na kilka małych modułów ARM + NPU przy poszczególnych liniach. Koszt jednostkowy spadł, łatwiej też było planować serwis – awaria jednego modułu nie zatrzymywała całej hali.
Integracja sprzętu z istniejącą infrastrukturą OT
Sprzęt edge nie działa w próżni – musi współgrać z istniejącymi sieciami, szafami, normami zakładowymi. Przy wdrożeniach pojawiają się powtarzalne tematy:
- Strefy bezpieczeństwa i ATEX – w obszarach zagrożonych wybuchem lub o podwyższonym ryzyku ogniowym trzeba przewidzieć odpowiednie obudowy, certyfikaty albo umieścić urządzenia poza strefą.
- Segmentacja sieci – oddzielenie sieci OT (PLC, sterowniki) od sieci IT/AI. Czasem urządzenie edge ma dwa interfejsy: jeden „twardy” do PLC, drugi „miękki” do systemów analitycznych.
- Standardy zakładowe – niektóre firmy upraszczają utrzymanie, narzucając jedną lub dwie rodziny IPC, dopuszczone systemy operacyjne, konkretne metody backupu. Warto się w to wpasować, zamiast wprowadzać egzotyczne wyjątki.
Najczęściej zadawane pytania (FAQ)
Co to jest Edge AI w przemyśle i czym różni się od AI w chmurze?
Edge AI w przemyśle to uruchamianie modeli sztucznej inteligencji bezpośrednio na urządzeniach blisko procesu – w kamerze, sterowniku, przemysłowym PC w szafie, a nie w zewnętrznym centrum danych. Obraz jest przetwarzany lokalnie, a do systemów nadrzędnych trafia jedynie wynik: OK/NOK, alarm, liczba sztuk, współrzędne obiektu.
W podejściu chmurowym surowy obraz lub wideo jest wysyłany do chmury, tam analizowany, a decyzja odsyłana z powrotem. To dodaje opóźnienia, wymaga stabilnego i wydajnego łącza oraz rodzi pytania o bezpieczeństwo i regulacje. Edge AI odwraca ten porządek: chmura może służyć do trenowania modeli i analizy historycznej, ale sama decyzja „tu i teraz” zapada na hali.
Kiedy lepiej wybrać Edge AI zamiast analizy obrazu w chmurze?
Edge AI ma przewagę tam, gdzie liczy się szybka, przewidywalna reakcja i gdzie internet bywa „wąskim gardłem”. Typowy próg: jeśli od wykonania zdjęcia do reakcji masz mniej niż ok. 100 ms (np. odrzucenie produktu z taśmy, zatrzymanie robota, wyłączenie prasy), lepiej postawić na inferencję lokalną.
Edge sprawdza się też, gdy:
- kamery pracują 24/7 i generują duży strumień danych, którego nie chcesz przepychać przez internet,
- zakład pracuje na zamkniętych sieciach bez stałego dostępu do chmury,
- pracujesz w branży z ostrymi regulacjami (farmacja, automotive, obronność) i nie możesz wysyłać obrazu na zewnątrz.
Najczęstszy kompromis wygląda tak: decyzje w czasie rzeczywistym na brzegu, a do chmury idą tylko zanonimizowane dane zbiorcze.
Jakie są najczęstsze zastosowania Edge AI do analizy obrazu na produkcji?
W zakładach produkcyjnych Edge AI najczęściej „patrzy” na cztery obszary. Po pierwsze kontrola jakości: wykrywanie rys, zanieczyszczeń, brakujących elementów, uszkodzonych opakowań czy błędnych nadruków. Kamera widzi to, czego człowiek przy szybkim takcie już nie wyłapie.
Po drugie bezpieczeństwo pracowników – wykrywanie człowieka w strefie niebezpiecznej, braku hełmu czy kamizelki, zbyt małej odległości od robota. Po trzecie śledzenie produktów: etykiety, kody kreskowe i 2D, OCR dat ważności, identyfikacja palet. Po czwarte monitoring procesów, np. wyglądu płomienia, poziomu napełnienia, obecności piany, koloru materiału przy zmianie receptury.
Jakie są główne ograniczenia analizy obrazu w chmurze w zakładach produkcyjnych?
W produkcji problemem nie jest „czy chmura działa”, tylko „czy działa zawsze i w czasie, który mnie ratuje”. Główne ograniczenia to:
- opóźnienia – suma przesyłu obrazu, przetwarzania i odpowiedzi często przekracza to, na co pozwala szybka linia,
- stabilność łącza – każde „zacięcie” internetu oznacza brak decyzji z systemu wizyjnego,
- koszt i przepustowość – kilka kamer HD 24/7 potrafi zajechać nawet porządne łącze i wygenerować spore rachunki,
- regulacje i poufność – wysyłanie obrazu części, produktów czy ludzi poza zakład jest trudne do obrony przed działem bezpieczeństwa i compliance.
Do tego dochodzą przestoje po stronie dostawcy chmury. Dla biura to irytacja, dla produkcji – potencjalnie zatrzymana linia lub wadliwa partia.
Czy proste systemy wizyjne w kamerach to już Edge AI?
Nie zawsze. Od lat istnieją kamery ze „sprytną” analityką: wykrywaniem krawędzi, prostym pomiarem, porównaniem z wzorcem. To nadal logika oparta na sztywnych regułach: jeśli jasność poniżej progu – to defekt, jeśli obiekt nie mieści się w ramce – to NOK. Działa świetnie, o ile produkt i warunki są bardzo powtarzalne.
Edge AI korzysta z modeli uczonych na przykładach (uczenie maszynowe, sieci głębokie). Taki model rozpoznaje bardziej „miękkie” wzorce: różne rodzaje zarysowań, zmiany oświetlenia, nowe warianty produktu. Zamiast dopisywać kolejne reguły, pokazujesz mu kolejne przykłady. Różnica staje się wyraźna, gdy produkt ewoluuje lub warunki na hali nie są idealnie stałe.
Jak wygląda typowy przepływ danych w systemie Edge AI do analizy obrazu?
Na hali wszystko sprowadza się do kilku kroków. Najpierw kamera przechwytuje obraz lub klatkę wideo we właściwym momencie – często na sygnał z enkodera taśmy lub z PLC. Następnie urządzenie edge (kamera z wbudowanym modułem, IPC w szafie, mały serwer w zakładzie) wstępnie obrabia obraz i uruchamia model AI.
Model zwraca decyzję lub kilka liczb: OK/NOK, typ defektu, współrzędne obiektu, informację „człowiek w strefie / brak człowieka”. Te dane są przekazywane dalej – np. do PLC, który odrzuca produkt lub zatrzymuje maszynę, oraz do systemów MES/SCADA w formie statystyk. Internet może służyć tylko do okresowej synchronizacji lub zbierania zagregowanych danych, ale sam proces decyzyjny nie zależy od chmury.
Czy przy Edge AI chmura jest w ogóle potrzebna?
Nie musi być, ale często bardzo pomaga. Produkcja „tu i teraz” może działać całkowicie lokalnie, bez dostępu do internetu. Jednocześnie chmura świetnie sprawdza się jako „zaplecze analityczne”: do przechowywania zagregowanych danych, trenowania i aktualizacji modeli, raportowania do centrali czy porównywania wielu zakładów.
Praktyczny układ bywa taki: model działa na brzegu i nie potrzebuje chmury do decyzji, ale co jakiś czas część danych (np. statystyki defektów, zanonimizowane wycinki obrazu) trafia do chmury. Tam zespół data science analizuje trendy, poprawia model i odsyła nową wersję z powrotem na urządzenia edge, bez naruszania zasad bezpieczeństwa danych w zakładzie.
Najważniejsze punkty
- Edge AI na hali rozwiązuje problem opóźnień i niestabilnego internetu – decyzje (np. odrzucenie wadliwej sztuki) zapadają lokalnie w ułamkach sekund, niezależnie od kondycji łącza zewnętrznego.
- Przeniesienie analizy obrazu z chmury na urządzenia brzegowe dramatycznie zmniejsza przepływ danych i koszty łącza – do systemów nadrzędnych wysyłane są tylko wyniki (OK/NOK, alarm, liczba sztuk), a nie pełne strumienie wideo.
- Edge AI ułatwia spełnienie wymogów bezpieczeństwa i regulacji (RODO, NDA, branże wrażliwe) – obrazy produktów, części czy pracowników nie opuszczają zakładu, co upraszcza audyty i dyskusje z działem IT.
- Lokalne modele zwiększają odporność produkcji na awarie i przerwy po stronie dostawcy chmury – linia nie zatrzymuje się tylko dlatego, że „coś padło w data center”, bo kluczowe decyzje są podejmowane na miejscu.
- Najczęstsze zastosowania Edge AI w przemyśle to wizja maszynowa: kontrola jakości, bezpieczeństwo pracowników, śledzenie produktów i monitoring procesów, gdzie często wystarcza prosta decyzja typu „człowiek w strefie / brak człowieka”.
- Edge daje większą niezależność od jednego dostawcy technologii – zakład może wymieniać chmurę, frameworki czy integratora bez ruszania urządzeń działających przy liniach.
- Najrozsądniejszy model to podział ról: decyzje w czasie rzeczywistym na brzegu, a w chmurze jedynie agregacja, analizy historyczne, trenowanie modeli i raportowanie – na zredukowanych, często zanonimizowanych danych.






