Manuali i Përdoruesit për Klasifikimin e Zërit dhe Detektimin e Drejtimit të Zërit Hanwha Vision SPS-A100M AI

Përmbajtja fshehin

1 Hanwha Vision SPS-A100M Klasifikimi i Zërit me AI dhe Zbulimi i Drejtimit të Zërit

2 Hyrje

3 Teknologjia e Analizës së Audios e Bazuar në IA

4 Instalimi dhe Mjedisi: Një Udhëzues për Performancë Optimale

5 konkluzioni

6 Dokumentet / Burimet

6.1 Referencat

Hanwha Vision SPS-A100M Klasifikimi i Zërit me AI dhe Zbulimi i Drejtimit të Zërit

Hyrje

Zëri është shpesh një mjet mbikëqyrjeje i anashkaluar, por i fuqishëm, mes kërcënimeve të padukshme. Ndërsa sistemet konvencionale të mbikëqyrjes me video janë përqendruar në kapjen vizuale të asaj që po ndodh, mjedisi i sotëm i sigurisë ka evoluar për të njohur jo vetëm llojet e ngjarjeve zanore, por edhe burimet e tyre të sakta. Ndërsa kufijtë e sigurisë publike dhe mbrojtjes së aseteve zgjerohen, teknologjia e analizës audio ka potencialin të kontribuojë përtej ndihmës së thjeshtë në parandalimin e krimit dhe reagimin e shpejtë ndaj incidenteve.
Në këtë kontekst, teknologjia e Klasifikimit të Zërit e Hanwha Vision, e bazuar në të nxënit e thellë, ofron funksione inteligjente që njohin me saktësi ngjarje specifike audio - të tilla si britmat e para-trajnuara dhe thyerja e xhamave - duke shkaktuar alarme të menjëhershme. Për më tepër, teknologjia e Zbulimit të Drejtimit të Zërit identifikon vendndodhjen e burimit të audios, duke dhënë informacion vendimtar jo vetëm mbi "çfarë është tingulli", por edhe mbi "ku ka origjinën tingulli". Këto dy teknologji punojnë në sinergji për të maksimizuar aftësitë e integruara të ndërgjegjësimit për situatën, duke vendosur një standard të ri për sistemet e sigurisë të gjeneratës së ardhshme.
Ky dokument i detajuar shqyrton këto teknologji, duke ofruar udhëzime praktike për zbatim dhe përdorim optimal në mjedise të ndryshme.

Teknologjia e Analizës së Audios e Bazuar në IA

Klasifikimi i tingujve
Teknologjia e Klasifikimit të Zërit e Hanwha Vision është ndërtuar mbi një model thelbësor të të mësuarit të thellë: Rrjeti Neural Konvolucional (CNN). Kjo teknologji fillon duke transformuar informacionin abstrakt të zërit në një formë vizuale të njohur si spektrogram1.
Një spektrogram vepron si një "gjurmë gishtash" akustike, duke shfaqur qartë modelet unike të një tingulli specifik. CNN shkëlqen në të mësuarit dhe njohjen automatike të karakteristikave dhe modeleve delikate akustike brenda këtyre imazheve të spektrogramit që shpesh janë të vështira për t'u dalluar nga veshi i njeriut. Ky proces mundëson identifikimin dhe klasifikimin e saktë të një game të gjerë ngjarjesh zanore, duke përfshirë ulërimat, thyerjen e xhamave, boritë e makinave dhe rrëshqitjet e gomave.
Pasi një tingull të jetë zbuluar dhe klasifikuar, sistemi automatikisht nxjerr të dhëna nga transmetimi audio. Meqenëse të dhënat audio janë tashmë të parapërpunuara dheampled, tingulli i klasifikuar gjenerohet më pas si një klip audio file, i plotë me metadata për shkarkim dhe riprodhim të lehtëview.
Kjo teknologji është e disponueshme në produkte të zgjedhura të Hanwha Vision.
Zbulimi i Drejtimit të Zërit
Teknologjia e Zbulimit të Drejtimit të Zërit e Hanwha Vision mbështet një reagim të shpejtë duke identifikuar dhe njoftuar përdoruesit për drejtimin e një ngjarjeje të caktuar audio. Teknologjia e përcakton këtë drejtim duke matur Diferencën Kohore të Mbërritjes.
(TDoA) të sinjalit zanor ndërsa arrin në mikrofonë të shumtë, të ndarë fizikisht.
Algoritmi TDoA funksionon duke analizuar ndryshimin e fazës në kohën që i duhet një tingulli për të arritur në secilin mikrofon, duke vlerësuar kështu distancën aktuale nga burimi. Ky informacion përdoret më pas për të llogaritur këndin e burimit të tingullit. Siç ilustrohet në Figurën 1, një sistem me shumë mikrofonë me mikrofonë (MIC1, MIC2, MIC3, MIC4) të rregulluar në një rreth mund të përcaktojë ndryshimet e distancës (d1, d2, d3, d4) midis burimit të tingullit dhe secilit mikrofon. Llogaritja e ndryshimit kohor të mbërritjes bazuar në këto ndryshime në distancë është thelbi i algoritmit TDoA.

Figura 2 tregon vizualisht ndryshimin kohor (τij) në mbërritjen e një sinjali zanor në dy mikrofonë (forma valore kafe dhe blu). Duke matur me saktësi këto ndryshime kohore të mbërritjes, sistemi mund të triangulojë me saktësi drejtimin e burimit të tingullit.

Procesi i zbulimit të drejtimit të zërit ndahet në katër hapa kryesorë:

Mbledhja e sinjaleve: Mbledh njëkohësisht sinjalet zanore nëpërmjet mikrofonave të shumtë.
Përpunimi i sinjalit: Analizoni sinjalet e mbledhura duke përdorur një algoritëm të specializuar.
Vlerësimi i drejtimit: Vlerësoni drejtimin e zërit bazuar në sinjalin e përpunuar.

Rezultati dalës: Shfaq drejtimin përfundimtar të zbuluar si kënd drejtimi.

Kjo teknologji është e disponueshme në produktet Hanwha Vision që mbështesin mikrofonë të shumtë, siç është Audio Beacon (SPS-A100M) dhe disa kamera të pajisura me Wisenet 9 SoC.

Instalimi dhe Mjedisi: Një Udhëzues për Performancë Optimale

Efektiviteti i Zgjidhjes Audio me IA të Hanwha Vision është i lidhur ngushtë me mjedisin e instalimit të saj. Duke marrë në konsideratë në mënyrë aktive pikat e mëposhtme, mund të maksimizoni potencialin e sistemit dhe të siguroni performancë të qëndrueshme.

Zgjedhja e Vendndodhjes Optimale të Instalimit
Për performancë të besueshme të Klasifikimit të Tingujve dhe Zbulimit të Drejtimit, rekomandohen kushtet e mëposhtme:
Klasifikimi i Zërit: Sistemi funksionon më me besueshmëri kur distanca midis produktit dhe burimit të zërit është të paktën 2 m. Kjo distancë bazohet në lartësinë e një burimi zëri. Nëse distanca është shumë afër (brenda 2 m), edhe një tingull në dukje me volum të ulët, si një duartrokitje, mund të bëhet tepër i lartë, duke çuar në rezultate të rreme pozitive. Instalimi në tavan në një mjedis të brendshëm është një metodë ideale për klasifikimin e zërit pasi minimizon reflektimet akustike dhe lejon zbulimin uniform të zërit në një zonë të gjerë.

Zbulimi i Drejtimit të Zërit: Për zbulimin e saktë të drejtimit, rekomandohet një hapësirë minimale prej të paktën 6.0 m të gjerë me 6.0 m të gjatë. Kjo minimizon efektet e reflektimeve dhe jehonave të zërit dhe siguron hapësirë të mjaftueshme për analizën e sinjalit midis mikrofonave të shumtë.

Ruajtja e Distancës dhe Këndit të Incidentit të Duhur: Distanca dhe këndi midis burimit të tingullit të ngjarjes dhe produktit janë kritike për saktësinë e zbulimit. Nëse këndi i incidentit të tingullit të ngjarjes është shumë i madh (tejkalon 20°) ose distanca është shumë e shkurtër, saktësia e zbulimit mund të ulet. Tabela më poshtë jep distancat minimale të rekomanduara bazuar në lartësinë e instalimit të produktit.

Lartësia e instalimit të produktit	Distanca minimale e zbulimit të drejtimit
2.3 m	≥ 2.2 m
2.5 m	≥ 2.7 m
2.7 m	≥ 3.3 m
2.9 m	≥ 3.8 m
3.1 m	≥ 4.4 m
3.3 m	≥ 4.9 m
3.5 m	≥ 5.5 m
3.8 m	≥ 6.3 m
4m	≥ 6.9 m
5m	≥ 9.6 m

Sigurimi i një rruge të qartë zëri: Pengesa fizike si muret, xhamat ose perdet e trasha midis burimit të zërit dhe produktit mund ta dobësojnë ose shtrembërojnë sinjalin. Për të arritur performancën maksimale, sigurohuni që zëri të ketë një rrugë të qartë dhe të drejtpërdrejtë.

Analiza Mjedisore për Detektimin dhe Klasifikimin Efektiv të Zërit
Për zbulimin dhe klasifikimin e saktë të zërit, merrni parasysh kushtet akustike dhe faktorët mjedisorë përreth si më poshtë.

Lloji i zërit	Pragu i dB-së	Distanca e parashikuar
Duke bërtitur	> 70dB	2m~20m
Thyerje xhami, bori makinash, rrëshqitje gomash	> 80dB	2m~16m

Për shembullampPër shembull, një tingull ulëritës mund të klasifikohet me saktësi dhe të zbulohet në mënyrë të drejtuar kur volumi i tij është mbi 70dB. Volumi i tingullit të ngjarjes duhet të jetë gjithashtu dukshëm më i lartë se zhurma e sfondit përreth (rekomandohet: të paktën 30dB më i lartë). Për matje dhe klasifikim të saktë, zhurma e sfondit idealisht nuk duhet të kalojë 60dB, gjë që siguron një dallim të qartë midis zhurmës së ngjarjes dhe zhurmës së ambientit.
Meqenëse zhurma e ambientit mund të ndikojë në performancë, është praktikë e mirë të analizohen paraprakisht sa vijon:

Mjedise të Jashtme: Kini kujdes nga zhurmat natyrore (era, shiu, bubullima) dhe tingujt artificialë (trafiku, goditjet, dridhjet e makinave). Në mjedise të paparashikueshme, një analizë e plotë mund t'ju ndihmojë të zgjidhni vendndodhjen optimale të instalimit.

Mjedise të Brendshme: Reflektimet dhe jehonat e zërit mund të jenë të konsiderueshme në varësi të materialeve (muret, tavanet, dyshemetë) dhe madhësisë së dhomës. Tingujt që janë të ngjashëm me një ngjarje të caktuar, siç është shpërthimi i një tullumbace ose rënia e një kutie të rëndë, mund të krijojnë jehonë që çon në alarme të rreme. Instalimi duhet të marrë parasysh vetitë akustike të hapësirës së brendshme.

Konfigurimi i Klasifikimit të Zhurmës në Pragjet dB
Për të optimizuar funksionin e Klasifikimit të Zërit, mund ta konfiguroni pragun e dB-së që i përshtatet mjedisit tuaj specifik.

Në një mjedis me zhurmë, vendosni pragun më të lartë për të zvogëluar alarmet e rreme.
Në një mjedis të qetë ku ngjarjet janë të pakta, vendosni pragun më të ulët për të shmangur humbjen e njoftimeve të rëndësishme.

Pas kontrollit të nivelit mesatar të zhurmës në sfond në dB, rekomandohet të vendosni një prag të paktën 55 dB më të lartë se ai mesatar.

Siç tregohet në Figurën 6, pragu i dB mund të rregullohet në mënyrë intuitive duke përdorur një rrëshqitës ose një fushë hyrjeje numrash, duke ndikuar drejtpërdrejt në ndjeshmërinë e zbulimit në kohë reale. Grafiku përfaqëson vizualisht ndryshimin në dB të zhurmës me kalimin e kohës (vija e zezë) dhe pragun e konfiguruar (vija gri), duke e bërë të lehtë për të parë kur një ngjarje zanore (kulmi portokalli) tejkalon pragun.

Kalibrimi i Drejtimit të Zërit dhe Konfigurimi i Sistemit
Produktet Hanwha Vision ofrojnë ngjarje si klipe audio, të cilat përfshijnë si klasifikimin e zërit ashtu edhe rezultatet e zbulimit të drejtimit.

Siç tregohet në Figurën 7, rezultati i klasifikimit të zërit shfaqet me një ikonë intuitive në fund, së bashku me rezultatin e zbulimit të drejtimit të zërit. 'Drejtimi (N+301.8°)' do të thotë që burimi i zërit ndodhet 301.8° në drejtim të akrepave të orës nga Veriu (N).
Vlera shoqëruese e 'Besimit (0.74)' tregon një nivel besimi prej 74%. Kjo, së bashku me nivelin e presionit të zërit (52dB), i ndihmon përdoruesit të vlerësojnë me saktësi situatën dhe të reagojnë shpejt.
Informacioni i drejtimit të zërit të sistemit mund të devijojë nga veriu i vërtetë me kalimin e kohës ose për shkak të instalimit. Meqenëse informacioni i saktë i drejtimit është thelbësor, është e rëndësishme të kalibroni pikën e referencës së Veriut sipas nevojës. Kjo mund të bëhet duke përdorur njërën nga tre metodat:

Instaloni produktin në mënyrë që të jetë i kthyer nga veriu siç tregon një busullë.
Në menynë e produktit, shkoni te [Sistemi] > [Informacionet e produktit] > [Modaliteti i montimit] dhe futni direkt këndin e matur në drejtim të akrepave të orës nga busulla Veri deri te pika e referencës së kamerës.

Përdorni veçorinë e busullës të përfshirë në mjetin e instalimit Wisenet për një konfigurim fillestar më të përshtatshëm dhe të saktë.

Këshilla për Mjedise Akustike Komplekse

Mjedise Akustike Komplekse: Në një mjedis me tinguj të shumtë të njëkohshëm, modeli i IA-së mund t'i klasifikojë ato si një tingull të vetëm ose t'i klasifikojë gabimisht. Ky është një fenomen natyror; një analizë gjithëpërfshirëse e informacionit të ofruar nga sistemi do të ndihmojë në sigurimin e një ndërgjegjësimi të saktë për situatën.
Analiza Mjedisore për Alarme të Sakta: Modeli i klasifikimit të tingujve mund të gjenerojë alarme për tinguj që janë të ngjashëm me tingujt e ngjarjeve, por që nuk janë në kategoritë e klasifikimit - siç janë fërkimi i objekteve metalike, thirrjet e kafshëve, instrumentet muzikore ose zhurma të tjera të papritura dhe të fuqishme. Të kuptuarit e kësaj karakteristike të modelit ju lejon të parashikoni dhe të përgatiteni për alarme nga këto tinguj të jashtëzakonshëm, duke zvogëluar në mënyrë efektive konfuzionin e panevojshëm.

konkluzioni

Duke lëvizur përtej kufizimeve të vëzhgimit vizual, Zgjidhja Audio me IA e Hanwha Vision krijon një sistem paralajmërimi të hershëm vërtet gjithëpërfshirës që analizon në mënyrë inteligjente zërin.
Ky dokument shërben si një udhëzues praktik, duke ju fuqizuar të zbatoni dhe optimizoni teknologjinë për mjedisin tuaj specifik - nga instalimi fillestar deri te rregullimi i imët për performancë maksimale.
Ndërsa sfidat e sigurisë evoluojnë, Hanwha Vision mbetet e përkushtuar për të avancuar aftësitë e saj të analizës audio, duke siguruar një përvojë sigurie më të qëndrueshme, efikase dhe proaktive në çdo situatë.

Vizioni Hanwha

13488 Qendra e Kërkimit dhe Zhvillimit Hanwha Vision,
6 Pangyo-ro 319-gil, Bundang-gu, Seongnam-si, Gyeonggi-do, Korea www.HanwhaVision.com

Dokumentet / Burimet

Hanwha Vision SPS-A100M Klasifikimi i Zërit me AI dhe Zbulimi i Drejtimit të Zërit [pdfManuali i Përdoruesit
SPS-A100M Klasifikimi i Zërit me AI dhe Zbulimi i Drejtimit të Zërit, SPS-A100M, Klasifikimi i Zërit me AI dhe Zbulimi i Drejtimit të Zërit, Klasifikimi dhe Zbulimi i Drejtimit të Zërit, Zbulimi i Drejtimit të Zërit, Zbulimi i Drejtimit, Zbulimi

Referencat

Manuali i Përdoruesit