あひるの勉強部屋

つらつらつら~と不定期にカキコするブログ

丼のホストをメンテした話

こちらは smhn Advent Calendar 2023 7日目の記事です。

久々にsocial.mikutter.hachune.net(a.k.a smhn, s25t, mikutterサーバー)のホストのメンテナンスを行ったので記録です。

このところ環境の変化のダメージから丼自体の追従しかできておらず周辺のメンテナンスができていませんでした。(時期によっては丼の追従も怪しくて申し訳NASA
しかし 11/23 にサーバーの炎上記念 を開催してもらったのもあり、ここらで一つメンテをするかということで実施しました。(2boさんをはじめ、皆さんありがとうございました)

実施したメンテは大きく3つ

  • 炎上記念の記念品を使った厄払い
  • サーバー内部の掃除
  • 各種ソフトウェアのアップデート

炎上記念の記念品を使った厄払い

mikutterサーバーは神田明神のIT情報安全守護及び熱田神宮の災難除守のお守りによって守られています。
3年前の炎上障害から、原因の除去に加えて神頼みを追加してバフをかけている状態です。
炎上障害以降、燃えていないことから効果は明らかですね。

juyo.kandamyoujin.or.jp

今回は久々の物理メンテということもあって、更なるバフをかけたい気持ちがありました。
そこで炎上記念レースの記念品としていただいたゼッケンをメンテ前に掲げることでサーバーの業と競馬の業の対消滅を狙いました。

メンテ中にmacの充電器を足の小指に落とす重大インシデントが発生しましたが、バフをかけていたおかげでこの程度で済みました。
きっとこの儀式をしていなければサーバーは爆散していたことでしょう。知らんけど。

サーバー内部の掃除

1年以上掃除をせずに、ほぼ24/365で稼働していたため、それなりに埃が溜まっていました。
エアダスターと掃除機をフル活用し主要な箇所の埃を大まかに除くことはできたと思います。
当初想定より埃が溜まっていたため装備が足りず、完全に掃除しきることはできませんでしたが、残りは年末年始あたりに追加で行おうかと思っています。

特にCPUのヒートシンクの掃除が効いたのか、CPUの冷却効率が上昇しました。(ソフトウェアの更新により負荷が少し落ちたのでそれの影響もあるでしょうが)
ヒートシンクの隙間には埃が詰まりやすいので、定期的な掃除は必要ですね。

メンテ前後のCPU温度のグラフのスクリーンショット
メンテ前後のCPU温度のグラフ(期間は1w)

各種ソフトウェアのアップデート

OSやら各種ソフトウェアを更新しました。 更新前後を比較するとLoadAverageが有意に低下するなどしたので何やらパフォーマンスが向上してるっぽいです。

サボっていたdockerの更新も行ったことでようやくdockerのサブコマンドにcomposeが使えるようになりました。

他に更新後良かった点として、nvmeの温度がhwmonから取得できるようになっていたことです。
従来は nvme-cli の smart-log から取得していましたが、これの難点としてはroot権限を要求することでした。
それが最近のカーネルではhwmonから取得できるようになったのでそちらを参照する形に変更しました。
Linux 5.5 To Finally Expose NVMe Drive Temperatures Via HWMON - Phoronix

まとめ

事前にVPSにあるステージング環境で各種アップグレードを実施し手順の確認はしていましたが、物理サーバーの構成の違いによって何かしら起こる可能性はあったので若干ヒヤヒヤしつつも楽しめました。

次回は年末にできれば同様のメンテナンスを追加で行いたいと思っているので、その時はまたよろしくお願いします。

39.39 :mikuslime: