Trenden för Sveriges miljömål är i flera fall nedåtgående, och ett av de områden som visar negativ trend är målet ”Ett rikt växt- och djurliv”. Sveriges uppföljning av habitat- och fågeldirektivet påvisar ett utsatt läge för den biologiska mångfalden. Det är idag svårt och kostsamt att övervaka om de svenska miljömålen uppfylls. Insamling av ljud- och bilddata sker redan idag i en stor omfattning, men det finns en stor och outnyttjad potential att förenkla miljöövervakningen genom nya billiga datainsamlingsenheter och framför allt genom nya automatiska AI-baseradeanalyssystem. Manuell provtagning och datainsamling är tidskrävande och kostsam, vilket gör autonom ljud- och bilddatainsamling attraktivt, särskilt på otillgängliga platser som till exempel under vatten. I flera fall skulle allmänheten kunna anlitas för att hjälpa till med detektering av invasiva främmande arter med hjälp av en mobiltelefonapplikation som använder artificiell intelligens för artidentifiering. I denna rapport granskas State of the art, det vill säga resultat och teknik i forskningsfronten, när det gäller användning av ljud- och bilddata för bullerövervakning och bullerkartläggning, för artidentifiering av djur och växter och för övervakning av invasiva främmande arter. Rapporten granskar och analyserar nuvarande och framväxande teknik och metoder och bedömer deras mognad, tillgänglighet och tillförlitlighet.
Denna rapport syftar till att redovisa möjligheter och utmaningar kopplade till:
- System för att samla in bullerdata för att modellera bullerpåverkan i de terrestra och akvatiska domänerna och möjliggöra bullerkartläggning.
- System för autonom ljud- och bildbaserad artidentifiering, uppskattning av population och övervakning av biologisk mångfald.
- System för detektion av invasiva främmande arter, till exempel med mobiltelefonapp.
Ekoakustisk bullerdatainsamling Biologiska tillämpningar inom akustik kallas bioakustik eller ekoakustik. De mestutforskade områdena med passiv akustisk övervakning eller PAM, är djurläten i ultraljudsområdet (exempel är fladder-möss och valar), eftersom traditionella analysmetoder kan användas i de fallen. PAM kan till exempel realiseras med ljudboxar, enskilda eller i matriser, eller med halsband eller inopererade enheter på enskilda djurindivider. Akustiskt aktiva djur inrättar sig efter varandra och övriga ljud, varför ljudlandskap anses ge information om biosystemets hälsa. Det viktigt att adressera hela mätkedjan i PAM-teknik. Rapportens översikt av hårdvara fokuseras mot ljud, eftersom kamerateknik är etablerat i svensk viltvård. De flesta hårdvarukomponenter i mätkedjan behöver väljas från praktisk synvinkelför att fungera bra i mätsystem, till exempel batteritid, minneshantering eller uppkopplingsmöjligheter, och låg kostnad om många insamlingsenheter behövs. Rapporten innehåller även en översikt av autonoma system eller integrerade enheter som täcker hela mätkedjan vid insamling av ljuddata. Möjligheterna att kombineraljud- och bilddata för analys används sällan idag, och det kan finnas stora vinster att göra inom detta fält. Framgångsrika AI-baserade analysmetoder har inte slagit igenom i kommersiella mjukvaruprogram. Det är ett stort tryck inom forskarvärlden på att tillgängliggöraanalysresultat, analysverktyg och insamlade data, för att kunna återanvända data och resultat av resursskäl, och erbjuda större datatäckning. Även standardiserade format på metadata efterfrågas, syftande mot internationell forskningspraxis. Framgångarna inom medborgarforskning kan delvis tillskrivas nya verktygimplementerade i mobilappar, men det finns en stor utvecklingspotential att skräddarsy verktyg och metoder efter verksamheter och faktiska behov.
AI inom bioakustik –State of the art De AI-basera de metoder som används mest inom bioakustik är djupinlärningsmetoder, framför allt olika former av neurala nätverk som lämpar sig för resurskrävandelyssning och bildgranskande. Det största området är fågelklassificering. Den vanligaste typen av neuralt nätverk inom bioakustik är CNN (convolutional neural network), vilken är viktig inom bild- och ljudanalys, men nya varianterutvecklas ständigt. Ofta används spektrogram (en bildrepresentation av ljud) som indata till djupinlärningsmodeller, men många varianter har visats fungera. Melspektrogram är det som funkat bäst i bioakustiska sammanhang, på grund av att frekvensskalningen avbildar läten likadant oavsett tonhöjd, vilket passar nätverk av CNN-typ. Observera att samma rådata kan ligga till grund för olika typer av träningsindata, om de har tillräckligt bra kvalitet och upplösning. Kraven på högupplöstdata väntas öka, vilket är viktigt om insamlade rådata ska kunna användas i framtiden, liksom kraven att metadata ska kopplas till konstaterade observationer. För maskinlyssning har en femtonfaldig ökning skett av antalet publikationer i området mellan 1998–2018. Skattning av populationstäthet hos fåglar med hjälp av maskinlyssning har visat sig ge lika bra resultat som manuell punkträkning, med avseende på nyckelparametrar som antal noterade fågelarter. Metoder som inte kräver manuell klassificering av upplärningsdata är en lovande framåt för bullerreducering och källseparering. Vid brist på annoterade indata förträning av modeller kan ”embedding functions” användas. Från området stadsbuller finns metoder för att realtidsströmma data med hjälp av distribuerade nät. Aktiva inlärningsmetoder, det vill säga metoder där experter aktivt deltar i inlärningsprocessen, ger snabbt kraftfulla resultat. En intressant variant på detta är att träna djur för att göra val som blir annoteringar av indata. Detta ger en modell som representerar djurens egen perception, vilket dock får användas med försiktighet. Sammanfattningsvis ses inte en omfattande satsning på bullerdatainsamling utanför Sveriges bebyggda områden eller runt Sveriges kuster som realistisk i dagensläge, men det finns stora möjligheter att integrera autonom artidentifiering i depågående övervakningsaktiviteter som bedrivs i svensk natur eller som ett proof-of concept.
Stockholm: Naturvårdsverket, 2022. , p. 87