{"id":28944,"date":"2023-08-12T04:32:37","date_gmt":"2023-08-12T04:32:37","guid":{"rendered":"https:\/\/matob.web.id\/note\/?p=28944"},"modified":"2023-08-12T04:32:37","modified_gmt":"2023-08-12T04:32:37","slug":"3-metrik-pemantauan-server-untuk-melacak-kesehatan-dan-kinerja-sistem","status":"publish","type":"post","link":"https:\/\/matob.web.id\/note\/3-metrik-pemantauan-server-untuk-melacak-kesehatan-dan-kinerja-sistem\/","title":{"rendered":"3 METRIK PEMANTAUAN SERVER UNTUK MELACAK KESEHATAN DAN KINERJA SISTEM"},"content":{"rendered":"<p>Jaminan kualitas memerlukan kombinasi tindakan proaktif dan protokol reaktif yang efisien.\u00a0Dengan keseimbangan yang tepat, Anda dapat memberikan layanan dan fungsionalitas yang sangat baik kepada pengguna di server yang tersedia sepanjang tahun.\u00a0Satu-satunya cara untuk mencapai keseimbangan itu adalah dengan mengidentifikasi metrik pemantauan server yang paling relevan.<\/p>\n<p>Dengan memilih <a href=\"https:\/\/matob.web.id\/note\/3-metrik-pemantauan-server-untuk-melacak-kesehatan-dan-kinerja-sistem\/\">metrik pemantauan server<\/a> yang ideal sejak awal, Anda dapat mengembangkan baseline kinerja untuk digunakan sebagai referensi ketika masalah kesehatan dan kinerja tak terhindarkan muncul.<\/p>\n<p>Dalam panduan singkat ini, kita akan melihat mengapa Anda harus melacak metrik utama ini.\u00a0Plus, Anda akan mendapatkan wawasan tambahan tentang relevansinya dan cara melacaknya.<\/p>\n<h2>1. Penggunaan CPU<\/h2>\n<p>Salah satu alasan utama untuk <a href=\"https:\/\/research.spec.org\/icpe_proceedings\/2020\/proceedings\/p4.pdf\" target=\"_blank\" rel=\"noopener\">pemantauan server<\/a>\u00a0adalah untuk mengawasi kesehatan infrastruktur dan kinerja server dasar.\u00a0Bagian penting dari itu adalah diagnosis proaktif dan mitigasi potensi masalah kinerja.\u00a0Pengukuran penggunaan CPU dan disk sangat penting untuk upaya ini.\u00a0Oleh karena itu, penggunaan CPU adalah salah satu metrik kinerja\u00a0yang paling mendasar dan sering dipantau\u00a0.<\/p>\n<p>Metrik ini dianggap\u00a0<strong><em>&#8220;berbasis host&#8221;,<\/em><\/strong>\u00a0karena mencatat kemampuan mesin individual untuk bekerja dan tetap stabil.\u00a0Yang mengatakan, pemantauan penggunaan CPU akan memerlukan kombinasi pemantauan pasif dan aktif.\u00a0Yang terakhir ini sangat berguna untuk pengujian beban terkontrol, sedangkan yang pertama mengumpulkan pengukuran pada target selama lalu lintas nyata.<\/p>\n<h3>Bagaimana Mengukur Utilisasi CPU<\/h3>\n<p>Sebelum memulai, Anda harus:<\/p>\n<ol>\n<li>Pilih drive tertentu yang ingin Anda pantau.<\/li>\n<li>Tentukan di mana drive tersebut berada.<\/li>\n<li>Pastikan pengumpul data Anda memiliki akses ke proses komputer Anda.<\/li>\n<\/ol>\n<p>Setelah Anda menyiapkan semua itu, Anda harus menentukan tingkat sampel yang Anda inginkan untuk melacak metrik ini.\u00a0Misalnya, Anda dapat mengukur penggunaan CPU setiap 30 detik atau satu menit.<\/p>\n<p>Ada beberapa cara berbeda untuk melacak penggunaan CPU, seperti menggunakan pengelola tugas Anda atau perintah seperti wmic CPU get load persentase untuk sistem Windows.\u00a0Namun, ketika Anda mencoba untuk mendapatkan pandangan sekilas dari <a href=\"https:\/\/matob.web.id\/random\/technology\/server\/\">server<\/a> Anda, yang terbaik adalah menampilkan data ini di dasbor.<\/p>\n<p><strong>Ingat:<\/strong>\u00a0Kinerja CPU dipengaruhi oleh kondisi perangkat keras, seperti suhu CPU dan kecepatan kipas.\u00a0Anda mungkin ingin memantau faktor-faktor ini di samping pemanfaatan (diwakili sebagai persentase) di dua status ini, mengabaikan idle.<\/p>\n<div>\n<div>\n<figure>\n<table>\n<tbody>\n<tr>\n<td><strong>Sibuk<\/strong><\/td>\n<td>Selama waktu ini, CPU sedang menjalankan tugas.<\/td>\n<\/tr>\n<tr>\n<td><strong>I\/O\u00a0<\/strong><\/td>\n<td>Keadaan ini tidak sibuk, tetapi juga tidak menganggur.\u00a0Sebagai gantinya, CPU bisa menunggu<br \/>\noperasi I\/O untuk menjalankan tugas, biasanya dengan menunggu untuk mengeluarkan data atau menerima data.<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/figure>\n<\/div>\n<\/div>\n<p>Dua hal utama yang ingin Anda pantau dengan cermat termasuk Waktu Istimewa dan Waktu Pengguna, karena jumlah dari keduanya akan memberi Anda Waktu Prosesor, masing-masing didefinisikan sebagai berikut:<\/p>\n<ul>\n<li><strong>Privileged Time:<\/strong>\u00a0Persentase waktu yang digunakan prosesor untuk mengeksekusi proses non-pengguna (yaitu, proses kernel)<\/li>\n<li><strong>User Time:<\/strong>\u00a0Persentase waktu yang digunakan prosesor untuk menjalankan proses pengguna (misalnya, shell perintah, server email, kompiler)<\/li>\n<li><strong>Processor Time:<\/strong>\u00a0Jumlah total waktu CPU sibuk<\/li>\n<\/ul>\n<p>Ingatlah bahwa melebihi 100% tidak selalu berarti bahwa sistem kelebihan beban.\u00a0Misalnya, jika Anda memiliki sistem multiprosesor, ini hanya berarti bahwa\u00a0<em>jumlah<\/em>\u00a0dari dua atau lebih CPU lebih besar dari 100% (misalnya, 50% dan 60%).\u00a0Tonton penampilan individu mereka untuk menjaga kesehatan sistem.<\/p>\n<p>Seiring dengan pemanfaatan CPU dan disk, menunggu juga dianggap penting dalam kesehatan infrastruktur dan pemantauan kinerja.<\/p>\n<h2>2. Server uptime<\/h2>\n<p>Server Anda tidak berguna jika tidak tersedia untuk pengguna Anda.\u00a0Dengan demikian, pemantauan uptime server tidak dapat dinegosiasikan.\u00a0Kapan pun ketersediaan server Anda turun di bawah 99,999% (standar yang dikenal sebagai\u00a0<strong><em>&#8220;lima sembilan&#8221;<\/em><\/strong>\u00a0), Anda menghadapi masalah serius.<\/p>\n<p>Gunakan rumus di bawah ini untuk mendapatkan wawasan yang dapat dipahami dan dapat ditindaklanjuti dari upaya pemantauan Anda.<\/p>\n<h3>Bagaimana Mengukur Uptime Server<\/h3>\n<p>Berikut adalah beberapa konsep inti yang perlu diketahui saat memantau waktu aktif server:<\/p>\n<ul>\n<li><strong>Uptime:<\/strong> Jumlah waktu layanan atau aplikasi Anda aktif dan tersedia untuk pengguna.\u00a0Rumus: <em>(Total time \u2013 Downtime)\/Total time\u00a0<\/em><\/li>\n<li><strong>Mean time between failures (MTBF):<\/strong> Waktu rata-rata yang memisahkan insiden waktu henti.\u00a0Rumus: <em>(Total time \u2013 Downtime)\/Number of downtime incidents\u00a0<\/em><\/li>\n<li><strong>Mean time to resolution (MTTR):<\/strong> Jumlah rata-rata waktu yang diperlukan untuk menyelesaikan pemadaman. Rumus:\u00a0<em>Total downtime\/Number of downtime incidents\u00a0<\/em><\/li>\n<li><strong>Mean time to acknowledge (MTTA):<\/strong> Jumlah rata-rata waktu yang dibutuhkan untuk mengakui pemadaman saat ini. Rumus: <em>Total time to acknowledge\/Number of downtime incidents\u00a0<\/em><\/li>\n<\/ul>\n<p>Semua metrik ini membantu mengembangkan gambaran besar yang menggambarkan keandalan infrastruktur Anda dan daya tanggap tim Anda.<\/p>\n<p>Jadi, misalnya, memiliki MTTR dan MTTA yang sehat itu baik.\u00a0Tetapi jika Anda juga memiliki MTBF yang tinggi, Anda harus menyelidiki akar penyebab downtime server Anda lebih lanjut.\u00a0Jika tidak, perusahaan masih berisiko mengalami kerugian finansial yang signifikan dan merusak kepercayaan pengguna.<\/p>\n<figure id=\"attachment_28945\" aria-describedby=\"caption-attachment-28945\" style=\"width: 1024px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-28945 size-full\" src=\"https:\/\/matob.web.id\/note\/wp-content\/uploads\/sites\/3\/2022\/06\/grafana-dashboard-screenshot-1024x516-1.webp\" alt=\"Anda dapat menggunakan alat pemantauan server untuk mempermudah metrik pelacakan.\" width=\"1024\" height=\"516\" title=\"\" srcset=\"https:\/\/matob.web.id\/note\/wp-content\/uploads\/sites\/3\/2022\/06\/grafana-dashboard-screenshot-1024x516-1.webp 1024w, https:\/\/matob.web.id\/note\/wp-content\/uploads\/sites\/3\/2022\/06\/grafana-dashboard-screenshot-1024x516-1-768x387.webp 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption id=\"caption-attachment-28945\" class=\"wp-caption-text\">Anda dapat menggunakan alat pemantauan server untuk mempermudah metrik pelacakan.<\/figcaption><\/figure>\n<p>Pada akhirnya, Anda harus berjuang untuk <strong><em>\u201cfive nines,\u201d<\/em><\/strong>\u00a0\u00a0menjaga waktu henti maksimum kira-kira lima menit per tahun.\u00a0Perangkat lunak pemantauan server Grafana dan Prometheus umumnya direkomendasikan sebagai alat yang ramah pengguna dan mudah diakses untuk aspek pemantauan kinerja ini.<\/p>\n<h2>3. Transactions (and error rates)<\/h2>\n<p>Anda memerlukan gambaran yang jelas tentang seberapa banyak lalu lintas yang didukung infrastruktur Anda pada waktu tertentu.\u00a0Jadi, penting untuk mengawasi transaksi Anda\u2014atau jumlah permintaan per detik\u2014dan waktu respons rata-rata yang sesuai.\u00a0Informasi ini dapat membantu Anda menentukan jumlah sumber daya dan kapasitas yang dibutuhkan untuk menjalankan server dengan lancar.<\/p>\n<p>Pada saat yang sama, melacak tingkat kesalahan, atau persentase permintaan yang gagal relatif terhadap total yang diterima, dapat memberikan wawasan lebih lanjut mengenai kapasitas beban layanan Anda.\u00a0Untuk memaksimalkan nilai metrik ini, yang terbaik adalah mengembangkan baseline lembur melalui pemantauan pasif.<\/p>\n<p>Hal ini penting untuk kemampuan Anda untuk memantau\u00a0<strong>tren<\/strong>\u00a0.\u00a0Jika Anda dapat melihat ke belakang dan menentukan kapasitas dan sumber daya maksimum yang diperlukan untuk kelancaran operasi, Anda dapat bertindak secara proaktif untuk mengalokasikan kebutuhan tersebut dan menunjukkan masalah infrastruktur untuk mengurangi tingkat kesalahan yang diamati dan mengoptimalkan waktu respons rata-rata Anda.<\/p>\n<h3>Cara Memantau\u00a0Transactions and Error Rates<\/h3>\n<p>Berikut ini adalah alat yang andal untuk teknik pemantauan kinerja pasif:<\/p>\n<ul>\n<li><strong>Sniffers:<\/strong>\u00a0Ini dirancang untuk mengumpulkan pengukuran pada\u00a0<strong><em>&#8220;tingkat mikroskopis&#8221;<\/em><\/strong>\u00a0dengan\u00a0<strong><em>&#8220;menguping&#8221;<\/em><\/strong>\u00a0arus lalu lintas di jaringan kabel dan nirkabel.\u00a0Wireshark adalah salah satu standar yang paling banyak diterima, yang mengumpulkan data tentang atribut seperti cap waktu, alamat MAC dan IP, waktu tayang, dan banyak lagi.\u00a0Ini dapat digunakan secara online atau offline.<\/li>\n<li><strong>Logging facilities:<\/strong> Ini biasanya terintegrasi ke dalam sistem operasi dan aplikasi. Mereka terutama mengumpulkan informasi tentang aktivitas dan peristiwa yang dihasilkan oleh aplikasi untuk penggunaan offline.<\/li>\n<\/ul>\n<p>Salah satu dari\u00a0sepuluh alat pemantauan server web teratas\u00a0yang sangat baik untuk memantau transaksi adalah Monitis.\u00a0Ini adalah sistem pemantauan lengkap untuk server, situs web, dan aplikasi.\u00a0Ini bagus untuk sistem Windows dan Linux, dan ideal untuk mencakup dasar-dasarnya, termasuk waktu aktif.<\/p>\n<p>Tujuan dan sasaran dari upaya pemantauan akan mempengaruhi pengukuran yang tepat dan penggunaan teknik ini.<\/p>\n<h3>Metrik Lain untuk Dipantau dengan Transaksi<\/h3>\n<p><strong>Waktu respons<\/strong>\u00a0dan\u00a0<strong>jumlah total utas<\/strong>\u00a0terkait langsung dengan transaksi.\u00a0Ini akan memberi tahu Anda berapa lama waktu yang dibutuhkan server Anda untuk menanggapi permintaan, dan jumlah utas (yang membuat transaksi terjadi) yang digunakan untuk menangani semua permintaan ini.<\/p>\n<p>Setiap utas menggunakan waktu <a href=\"https:\/\/matob.web.id\/note\/apa-yang-dimaksud-dengan-cpu-dan-kepanjangan-cpu\/\">CPU<\/a> dan RAM.\u00a0Terlalu banyak dapat menyebabkan kinerja di bawah standar.\u00a0Ada cukup banyak untuk dipantau dengan ini, termasuk:<\/p>\n<ul>\n<li>Jumlah total utas di server web atau kumpulan penampung, termasuk jenis berikut:\n<ul>\n<li><em>Active\u00a0<\/em><\/li>\n<li><em>Idle\u00a0<\/em><\/li>\n<li><em>Stuck\u00a0<\/em><\/li>\n<li><em>Standby\u00a0<\/em><\/li>\n<\/ul>\n<\/li>\n<li>Permintaan pengguna yang tertunda dan panjang antrian<\/li>\n<\/ul>\n<p>Anda biasanya dapat mengukur waktu respons server sebagai <em>Time to First Byte (TTFB)<\/em>.\u00a0Ini adalah jumlah milidetik yang diperlukan browser untuk menerima byte pertama dari respons server.\u00a0Umumnya, apa pun yang lebih dari lima detik sangat penting.<\/p>\n<h2>Memilih Metrik yang Tepat Untuk Pemantauan Kinerja Server<\/h2>\n<p>Ada daftar panjang metrik yang dapat Anda pantau saat Anda melacak kesehatan dan kinerja server Anda, tetapi target spesifik terutama bergantung pada tujuan upaya pemantauan Anda.<\/p>\n<p>Sementara beberapa yang terbaik untuk mendapatkan wawasan tentang kapasitas beban perangkat keras dan sistem operasi Anda, yang lain ideal untuk mengamati aktivitas pengguna.\u00a0Bagaimanapun, CPU, waktu aktif, dan transaksi adalah hal mendasar yang tidak dapat diabaikan.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Jaminan kualitas memerlukan kombinasi tindakan proaktif dan protokol reaktif yang efisien.\u00a0Dengan keseimbangan yang tepat, Anda dapat memberikan layanan dan fungsionalitas yang sangat baik kepada pengguna di server yang tersedia sepanjang tahun.\u00a0Satu-satunya cara untuk mencapai keseimbangan itu adalah dengan mengidentifikasi metrik pemantauan server yang paling relevan. Dengan memilih metrik pemantauan server yang ideal sejak awal, Anda [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":28946,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-28944","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-sains-teknologi"],"_links":{"self":[{"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/posts\/28944","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/comments?post=28944"}],"version-history":[{"count":4,"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/posts\/28944\/revisions"}],"predecessor-version":[{"id":28950,"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/posts\/28944\/revisions\/28950"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/media\/28946"}],"wp:attachment":[{"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/media?parent=28944"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/categories?post=28944"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/matob.web.id\/note\/wp-json\/wp\/v2\/tags?post=28944"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}