catch-img

不具合原因をらくらく確認(前編):Mist


こんにちは。今日は”チームMist"にてブログをお届けします。


緊急事態宣言もようやく解除されましたね。
弊社は基本テレワーク勤務となっており、著者の私も日々運動どころかなかなか家を出ることがないのですが、
​​​​​​​食欲の秋、スポーツの秋を楽しむために少しずつ外出も増やそうと思います。


今回のテーマは「 Mistで原因不明の不具合を確認してみよう! 」です。


既に他記事でもご紹介しておりますが、MistはAI搭載型の唯一の無線LANです。
(参照:「AI」が無線LAN運用を劇的に進化させる 前編後編
このAI機能のおかげで、何か不具合が起きた際にも、誰でも簡単にその原因の確認・特定が可能となります。

Mistを使い始めたばかりの方Mist導入を検討している方など、比較的Mistに詳しくない方にも
分かりやすく、実際にどのように不具合原因を確認・特定できるのか、
その手順を前編、後編の2記事にてご紹介していきたいと思います。

目次[非表示]

  1. 1.はじめに(SLEのしきい値設定)
  2. 2.不具合原因の確認手順、見方について
  3. 3.①対象拠点の選択
  4. 4.②対象拠点での達成率や低下原因の確認
  5. 5.③サービスレベルの低下原因が示すもの
    1. 5.1.■Time to Connect
    2. 5.2.■Successful Connect 
    3. 5.3.■Coverage 
    4. 5.4.■Roaming 
    5. 5.5.■Throughput
    6. 5.6.■Capacity 
    7. 5.7.■AP Uptime 


はじめに(SLEのしきい値設定)

Mistでは、クラウドのAIがクライアントが発する通信パケットをチェックし、
Wi-Fiの快適さを可視化する機能があります。
それをMistでは「Service Level Expectations(SLE…サービスレベル期待値)」と呼んでいます。

このSLEは、出荷時から標準の値が設定されていますが、Mistを利用する環境、
つまりお客様によってSLEは異なってくるため、まずはこのSLEしきい値を設定する方法を見ていきましょう。

※お使いいただいて1ヶ月後くらいにSLEのしきい値を見直すのがオススメです


★SLEとは・・・AIで現状のwi-Fi環境を解析し、7つの指標に分けたもの
--------
•Time to Connect(アソシエート開始から認証完了までの時間)
•Successful Connect(接続の​​​​​​​成功率)
•Coverage(電波エリアのカバー率)
•Roaming(2AP間でローミングにかかる時間)
•Throughput(端末1台あたりのスループット)
•Capacity(APの収容能力)
•AP Uptime(APの起動時間)
-------------


不具合原因の確認手順、見方について

※今回は同一拠点で不具合が生じているケースとします。

①対象拠点の選択

1.左メニュー「Monitor」から「Service Levels」をクリックします
2.「Site」から対象拠点を選択し、「Wireless」をクリックします


②対象拠点での達成率や低下原因の確認

確認したい拠点のSLEについて、達成率やその低下原因を一覧で確認できます。
時間帯やSLE指標の表示順を変えることもできます。

 



③サービスレベルの低下原因が示すもの

『サービスレベル低下原因』それぞれが表している内容については↓を参照ください。

■Time to Connect

 しきい値よりも時間がかかった接続の数を追跡                  

Internet Services
dhcpと最初のdnsパケットの間の時間がこのサイトの移動平均から 2 シグマを超えている場合
Association
ユーザーが"関連付け"状態を通過する時間がこのサイトの平均関連付け待ち時間から2 シグマを超えている場合        
Authorization
ユーザーの「認証」状態を通過する時間がこのサイトの平均認証待ち時間から2 シグマを超える場合
DHCP
ユーザーのDHCP 時間が、このサイトで正常に完了した接続の平均 DCHP 時間から 2 シグマを超えている場合

■Successful Connect 

 ネットワークへの接続成功率や、DHCP接続の割合を追跡             

Authorization
承認プロセス中に認証に失敗した場合
Association
Association プロセス中に接続が失敗した 場合
DHCP
DHCP プロセス中に接続が失敗した場合

■Coverage 

 電波カバレッジで、しきい値を下回るユーザー割合                 

Asymmetry Downlink
APがクライアントからのアップリンクよりもクライアントが APからのダウンリンク信号が弱い場合
Weak Signal
RSSIしきい値を下回るユーザーが発生した場合
Asymmetry
UplinkAPからクライアントへのダウンリンクよりもクライアントから AP へのアップリンク信号が弱い場合

■Roaming 

 2つのAP間のローミング成功率を追跡                         

Slow Standard Roams
設定された低速ローミングしきい値を超える11r/OKC のない SSID のローミングが発生した場合
Slow 11r Roams
成功するまでに400ミリ秒を超えるか、11rの失敗があった場合
Slow OKC Roams
成功するまでに400ミリ秒を超えるか、OKC エラーが発生した場合
Failed To Fast Roam
高速ローミングが有効なSSIDで低速ローミングを行った高速ローミング対応クライアントが発生した場合

■Throughput

 通信速度において、しきい値を下回る時間                   

Device Capability
デバイスの容量(プロトコルnumStreams)が原因でスループットが設定されたしきい値を下回っているユーザが発生した場合
Coverage
クライアントの信号強度が弱いことが原因でスループットが設定されたしきい値を下回っているユーザが発生した場合
Network Issues
有線NWの容量が原因でスループットが設定されたしきい値を下回っているユーザが発生した場合
※有線NWの容量は定期的に測定

Capacity
APの負荷とWi-Fiチャネルの干渉が原因でスループットが設定されたしきい値を下回っているユーザが発生した場合


■Capacity 


 利用可能な帯域幅が~%以上の割合                       

Client Count
同じAPに接続されているクライアントが多すぎる場合
WiFi Interference
Wi-Fi干渉が原因で悪影響が出た可能性のあるクライアントが発生した場合
Non WiFi Interference
Wi-Fi以外の干渉が原因で悪影響が出た可能性のあるクライアントが発生した場合
Client Usage
同じチャネルを使用しているクライアントが多すぎて負荷が発生している可能性のある低容量がクライアントで発生した場合

AP Uptime 

 AP リブート、 AP到達不能イベント、サイトダウンイベントを使用して計算    

AP Unreachable
APがクラウド接続を失った場合
※WANの問題かAPがスイッチから外されている場合にのみ発生

Site Down
サイト上のすべてのAPに到達できない 場合
AP Reboot
APが再起動またはダウンした場合
Switch Down
APが接続されているSWがダウンしている場合



ここまでの流れはご理解いただけましたでしょうか?
次回は更に、根本原因の特定方法をご紹介していきます!

ご不明点がある場合は、ぜひお気軽に下記「WEB問い合わせフォームへ」より
​​​​​​​お問い合わせくださいね!






チームMist

チームMist

Mist/Juniper大好き人間で構成されたチームです。