Sådan visualiseres komplekse data på Linux

Indholdsfortegnelse:

Anonim

Du har sikkert hørt om Elasticsearch - søgemaskinen, der giver dig mulighed for at indeksere og derefter hurtigt søge gennem dine data. Du har muligvis oprettet et par visualiseringer i Kibana, GUI for Elasticsearch, der peger og klikker dig gennem den slanke grænseflade.

Hvad du måske ikke har brugt, er et mindre kendt visualiserings-plugin kaldet Timelion.

Timelion er et fantastisk visualiseringsværktøj, der gør det muligt at skrive dine forespørgsler ud på sit enkle og kraftfulde ekspressionssprog for at få vist grafer. Det bruges til at vise tidsseriedata, såsom befolkningsvækst eller hits på dit websted.

  • Her er en liste over de bedste bærbare computere til udviklere
  • Tjek disse bedste distroer for udviklere
  • Crunch numre let på disse bedste arbejdsstationer
Om denne artikel

Denne artikel optrådte først i Linux Format Magazine, nummer # 269, offentliggjort i november 2022-2023.

Med Timelion kan vi beregne glidende gennemsnit, vise forskellen mellem dataene for sidste uge og i dag og lave nogle grundlæggende anomaliedetektering. Det er et nyttigt værktøj til at vide, hvordan man arbejder med. Lad os komme igang.

Installation

Hvis du er en almindelig Linux Format-læser, er der eksempler på docker-komponer til opsætning af en klynge i LXF261.

Ellers er installation af Elasticsearch og Kibana relativt ligetil. Det eneste krav er Java, som du muligvis allerede har installeret.

Hvis ikke en simpel sudo apt installation standard-jre installerer den på Debian-baserede distroer, eller en sudo dnf install java skal gøre det samme for Red Hat-familien af ​​distributioner.

Derefter skal du bare downloade den nyeste version af Elasticsearch og Kibana til den ønskede operativsystemsmag.

På tidspunktet for skrivningen er den seneste version kibana-7.8.1-linux-x86_64.tar.gz.

Du kan udtrække det med tjære -xvzf kibana-7.8.1-linux-x86_64.tar.gz, skifte til den udpakkede mappe og køre ./bin/kibana & for at fyre Kibana-forekomsten op.

Når du har udført nøjagtigt de samme trin for at konfigurere Elasticsearch, der erstatter 'kibana' for 'elasticsearch', skal du kunne navigere til http: // localhost: 5601 i din yndlingsbrowser og se en skinnende ny Kibana-grænseflade til at spille rundt med.

Hvis du foretrækker at installere pakker med en pakkehåndtering, har det samme link som før oplysninger om at tilføje Elastic repo til dit system og installere Kibana- og Elasticsearch-pakkerne på den måde.

Du kan overlejre grafer oven på hinanden og bruge formatering for at få dine grafer til at se bedst ud.

Få nogle data

Nyere versioner af Kibana gør det muligt at indtaste datasæt i vores klynge automatisk med Data Visualizer i stedet for at skulle oprette et script eller Logstash-konfiguration. Det kan håndtere datasæt i JSON- eller CSV-format samt nogle standardlogfiler såsom Apache-logfiler. Den eneste begrænsning er, at de er mindre end 100 MB i størrelse. Dette er mere end nok til vores formål.

Vi bruger verdensomspændende datasæt Covid-19 tilfælde fra EU's Open Data Portal. Vi downloadede CSV-filen fra sektionen Ressourcer på siden.

Hvis du har problemer, kan du vælge at downloade Excel .xlsx-versionen i stedet, åbne med LibreOffice Calc og gemme det som tekst CSV (.csv) -format. Der er også en JSON-version tilgængelig til download, som du kan bruge som et alternativ.

For at komme til Data Visualizer i Kibana skal du klikke på hamburgerikonet øverst til venstre, derefter Machine Learning og endelig Data Visualizer. Når der er klikket på Upload fil i feltet Importer data, skal du vælge eller trække og slippe en fil og vælge din csv-fil, der skal indtages.

Efter en kort analyse viser den nogle statistikker, som den har fundet fra de første 1.000 linjer i CSV-filen. Dette vil være, hvilket format det mener, hvert af felterne er i, såsom tekst, dato eller nummer, og fremhæv de øverste værdier, der findes i felterne.

Det gør normalt et godt stykke arbejde med at finde ud af dette for os. Hvis du har brug for at foretage justeringer, kan du klikke på Tilsidesæt indstillinger for at ændre - for eksempel navnet på feltet, som det vil blive indstillet i Elasticsearch.

Et feltnavn, som vi bør tilsidesætte, er datoRep, som repræsenterer datoen for det beregnede tal i vores datasæt. Timelion ved ikke, hvordan man bruger dette som tidsfelt som standard, så vi kan forenkle vores liv senere ved at omdøbe dette felt nu til noget, det vil genkende.

En god kandidat er tidsstempel. Klik på Anvend for at indstille det. Når du er tilfreds med, hvordan resten af ​​det ser ud, skal du klikke på Importer i bunden, give indekset et navn - vi valgte covid - og derefter klikke på Importer igen for at få dataene ind i din klynge.