Як візуалізувати складні дані в Linux

Напевно, ви вже чули про Elasticsearch - пошукову систему, яка дозволяє індексувати, а потім швидко здійснювати пошук у ваших даних. Можливо, ви створили кілька візуалізацій у Kibana, графічному інтерфейсі користувача для Elasticsearch, вказуючи та клацаючи ваш шлях через елегантний інтерфейс.

Можливо, ви не використовували менш відомий плагін візуалізації під назвою Timelion.

Timelion - це фантастичний інструмент створення візуалізації, який дає змогу записувати ваші запити простою та потужною мовою виразів для відображення графіків. Він використовується для відображення на вашому веб-сайті даних про часові ряди, таких як приріст населення чи звернення.

  • Ось список найкращих ноутбуків для розробників
  • Перевірте ці найкращі дистрибутиви для розробників
  • Легко стискайте номери на цих найкращих робочих станціях
Про цю статтю

Ця стаття вперше з’явилася у журналі Format Magazine, випуск No 269, опублікованому в листопаді 2022-2023 року.

За допомогою Timelion ми можемо розрахувати ковзаючі середні, відобразити різницю між даними минулого тижня та сьогодні та виконати деякі основні виявлення аномалій. Це корисний інструмент, щоб знати, як працювати. Давайте розпочнемо.

Встановлення

Якщо ви звичайний пристрій для читання формату Linux, для налаштування кластера в LXF261 є приклади складання докерів.

В іншому випадку встановлення Elasticsearch та Kibana є відносно простим. Єдина вимога - Java, яку ви, можливо, вже встановили.

Якщо не простий sudo apt install default-jre встановлює його на дистрибутивах, що базуються на Debian, або java sudo dnf install повинна зробити те саме для сімейства дистрибутивів Red Hat.

Тоді вам просто потрібно завантажити останню версію Elasticsearch та Kibana для вашого бажаного смаку операційної системи.

На момент написання останньої версії є kibana-7.8.1-linux-x86_64.tar.gz.

Ви можете витягти його за допомогою tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, змінити в витягнутий каталог і запустити ./bin/kibana &, щоб запустити екземпляр Kibana.

Коли ви зробили точно такі ж кроки для налаштування Elasticsearch, замінивши "kibana" на "elasticsearch", ви повинні мати можливість перейти до http: // localhost: 5601 у вашому улюбленому браузері і побачити новий блискучий інтерфейс Kibana для відтворення навколо с.

Якщо ви віддаєте перевагу встановлювати пакети за допомогою менеджера пакунків, за тим самим посиланням, що і раніше, міститься інформація про додавання репозитарію Elastic до вашої системи та встановлення пакетів Kibana та Elasticsearch таким чином.

Ви можете накладати графіки один на одного і використовувати форматування, щоб ваші графіки виглядали якнайкраще.

Отримайте деякі дані

Останні версії Kibana дозволяють автоматично додавати набори даних у наш кластер за допомогою візуалізатора даних, замість того, щоб створювати сценарій або конфігурацію Logstash. Він може мати справу з наборами даних у форматі JSON або CSV, а також з деякими стандартними файлами журналів, такими як журнали Apache. Єдине обмеження полягає в тому, що вони мають розмір менше 100 Мб. Цього для наших цілей більш ніж достатньо.

Ми використовуватимемо світовий набір даних про випадки Covid-19 із порталу відкритих даних ЄС. Ми завантажили файл CSV із розділу "Ресурси" на сторінці.

Якщо у вас виникли проблеми, ви можете замість цього завантажити версію Excel .xlsx, відкрити програму LibreOffice Calc та зберегти її як текстовий формат CSV (.csv). Також доступна для завантаження версія JSON, яку ви можете використовувати як альтернативу.

Щоб дістатися до Візуалізатора даних у Кібані, натисніть значок гамбургера у верхньому лівому куті, потім Машинне навчання і нарешті Візуалізатор даних. Одного разу клацніть Завантажити файл у полі Імпорт даних, а потім Виберіть або перетягніть файл і виберіть свій файл CSV для введення.

Після короткого аналізу він покаже статистику, яку виявив із перших 1000 рядків файлу CSV. Це буде формат, на який, на його думку, перебуває кожне з полів, наприклад, текст, дата або номер, і виділити найвищі значення, знайдені в полях.

Зазвичай це добре робить, з’ясовуючи це для нас. Якщо вам потрібно було зробити якісь налаштування, ви можете натиснути Замінити налаштування, щоб внести зміни - наприклад, ім'я поля, як воно буде встановлено в Elasticsearch.

Одне ім’я поля, яке ми повинні замінити, - це dateRep, яка представляє дату для обчисленої цифри в нашому наборі даних. Timelion не знатиме, як використовувати це як часове поле за замовчуванням, тому ми можемо спростити своє життя пізніше, перейменувавши це поле зараз на те, що він розпізнає.

Хороший кандидат є позначка часу. Клацніть Застосувати, щоб встановити це. Коли ви задоволені тим, як виглядає решта, натисніть Імпортувати внизу, дайте індексу ім’я - ми вибрали covid - і знову натисніть Імпортувати, щоб отримати дані у ваш кластер.

Цікаві статті...