Du har nog hört talas om Elasticsearch - sökmotorn som gör att du kan indexera och sedan snabbt söka igenom dina data. Du kanske har skapat några visualiseringar i Kibana, GUI för Elasticsearch, pekande och klicka dig igenom det snygga gränssnittet.
Vad du kanske inte har använt är ett mindre känt plugin för visualisering som heter Timelion.
Timelion är ett fantastiskt verktyg för visualiseringsskapande som gör det möjligt att skriva ut dina frågor på sitt enkla och kraftfulla uttrycksspråk för att visa grafer. Den används för att visa tidsseriedata som befolkningstillväxt eller träffar på din webbplats.
- Här är en lista över de bästa bärbara datorerna för utvecklare
- Kontrollera dessa bästa distros för utvecklare
- Crunch siffror med lätthet på dessa bästa arbetsstationer
Den här artikeln publicerades först i Linux Format Magazine, nummer 269, publicerad i november 2022-2023.
Med Timelion kan vi beräkna glidande medelvärden, visa skillnaden mellan data för förra veckan och idag och göra några grundläggande avvikelser. Det är ett användbart verktyg för att veta hur man arbetar med. Låt oss börja.
Installation
Om du är en vanlig Linux-formatläsare finns det dockerexempel för att skapa ett kluster i LXF261.
Annars är det enkelt att installera Elasticsearch och Kibana. Det enda kravet är Java, som du kanske redan har installerat.
Om inte en enkel sudo apt installation standard-jre installerar den på Debian-baserade distros eller en sudo dnf install java bör göra detsamma för Red Hat-familjen av distros.
Då behöver du bara ladda ner den senaste versionen av Elasticsearch och Kibana för önskad operativsystemsmak.
I skrivande stund är den senaste versionen kibana-7.8.1-linux-x86_64.tar.gz.
Du kan extrahera det med tjära -xvzf kibana-7.8.1-linux-x86_64.tar.gz, ändra till den extraherade katalogen och köra ./bin/kibana & för att aktivera Kibana-instansen.
När du har gjort exakt samma steg för att ställa in Elasticsearch, ersätta 'kibana' för 'elasticsearch', borde du kunna navigera till http: // localhost: 5601 i din favoritwebbläsare och se ett glänsande nytt Kibana-gränssnitt för att spela runt med.
Om du föredrar att installera paket med en pakethanterare har samma länk som tidigare information om hur du lägger till Elastic repo i ditt system och installerar Kibana- och Elasticsearch-paketen på det sättet.
Du kan överlagra grafer ovanpå varandra och använda formatering för att få dina grafer att se bäst ut.Få lite data
Nya versioner av Kibana gör det möjligt att automatiskt sätta in datamängder i vårt kluster med Data Visualizer istället för att behöva skapa ett skript eller Logstash-konfiguration. Det kan hantera datamängder i JSON- eller CSV-format samt vissa standardloggfiler som Apache-loggar. Den enda begränsningen är att de är mindre än 100 MB stora. Detta är mer än tillräckligt för våra ändamål.
Vi kommer att använda den globala datasetet Covid-19 från EU: s portal för öppna data. Vi laddade ner CSV-filen från avsnittet Resurser på sidan.
Om du har problem kan du välja att ladda ner Excel .xlsx-versionen istället, öppna med LibreOffice Calc och spara den som text CSV (.csv) -format. Det finns också en JSON-version tillgänglig för nedladdning som du kan använda som ett alternativ.
För att komma till Data Visualizer i Kibana, klicka på hamburgarikonen längst upp till vänster, sedan Machine Learning och slutligen Data Visualizer. När du väl har klickat på Ladda upp fil i rutan Importera data, välj eller dra och släpp en fil och välj din csv-fil som ska tas in.
Efter en kort analys kommer den att visa en del statistik att den upptäcks från de första 1 000 raderna i CSV-filen. Det här kommer att vara vilket format den tror att vart och ett av fälten är i, till exempel text, datum eller nummer och markera de bästa värdena i fälten.
Det gör vanligtvis ett bra jobb att räkna ut detta för oss. Om du behöver göra några justeringar kan du klicka på Åsidosätt inställningar för att ändra - till exempel namnet på fältet som det kommer att ställas in i Elasticsearch.
Ett fältnamn som vi bör åsidosätta är datumRep, som representerar datumet för den beräknade siffran i vår dataset. Timelion vet inte hur man använder detta som tidsfält som standard, så vi kan förenkla vårt liv senare genom att byta namn på det här fältet till något som det kommer att känna igen.
En bra kandidat är tidsstämpel. Klicka på Använd för att ställa in det. När du är nöjd med hur resten av den ser ut, klicka på Importera längst ner, ge indexet ett namn - vi valde covid - och klicka sedan på Importera igen för att få in data i ditt kluster.