WEB系各社で使われている監視ツールまとめ

次世代 Web カンファレンスで監視について話すことになったので、ネタとしてWEB系各社で使っている監視ツールを調査中。

うちはこれ使ってるよ!!!ってのがあったら@にメンションください!

Cookpad

  • Zabbix
    • 昔はNagios+muninだけど台数増えて性能的に破綻した
    • ビューはそのままじゃ辛いのでmunin風に表示するのを自作
  • StatusCake
  • DataDog。サービス系、サーバに紐付かない系の監視に。DashBoard便利
  • waker。通知用。PagerDuty高い、と言ってryot_a_raiが秒で作ったらしい
  • Kibana
  • imon。独自のリアルタイムなサービス稼働状況表示ツール
  • NewRelic
  • 試し中なもの
    • Real-User Monitoring : JSでbeacon飛ばしてfluentd -> BigQuery。Google SpreadSheet+GoogleAppsScriptでBIツールっぽく
    • ログ監視 : graylog

DeNA

  • nagios
  • ganglia
  • cloudforecast
  • pagerduty
  • haikanko

GREE

CyberAgent

  • 部署、グループごとに違ってて全貌を知るのは困難
  • Zabbix派とそれ以外派で宗教がわかれている
  • Zabbix以外で多いのはnagios+mon?
    • 一部で、作業時にmon監視外すのがダルい -> sensu
    • 一部で、sensuダルい -> Mackerel
  • muninも多いらしい
  • datadog, stackdriver, makarel
  • NewRelic, Cacti
  • kibana, sensu, proteus-monitor
  • CloudWatchMetrics, BigQuery, Norikra
  • ミドルウェア特化系 : clouderamanager(hadoop)、opscenter(cassandra)、amc(aerospike)
  • Grafana+InfluxDBを昔使っていた
    • InfluxDBがインデックス貼れないバージョンで1週間分のグラフ表示しようとすると3分ぐらいかかってて使い物にならない。0.9からはインデックス貼れるっぽいが
  • Mackerel月1ぐらいで5分ほど障害起きたりするので少しだけ不安

mixi

  • nagios
  • kibana/Fluentd/GrowthForecast
  • NewRelic
  • PagerDuty
  • CloudForecast
  • Zabbix
  • サービスごとに違うらしい

はてな

  • Mackerel
  • Nagios。過去の経緯、捨てたい
  • Kibana
  • Cacti(ネットワークのみ)

ペパボ

  • nagios, munin
  • mackerel
  • NewRelic
  • consul-alerts
  • Fluentd、kibana、TD、GrowthForecast

VOYAGE

  • Hobbit
  • Pandra FMS
  • cloudwatch
  • NewRelicを使ってるチームもある

CROOZ

  • hobbit
  • 一部、Elasticsearch+grafana。Zabbix

カヤック

  • Zabbix
  • 自社サービス系はzabbixで統一。受託はnagiosとかだけどmackerelにして行きたい気持ち

ドリコム

ハートビーツ

  • nagios, cacti
  • ラッパーとか中心に自作も進めてる

SmartNews

  • DataDog。サーバ監視他
  • NewRelic
  • PagerDuty

Gunosy

  • OS外cloudwatch
  • OS内datadog
  • プロセスmonit/supervisord
  • ログpapertrail/kibana
  • 通知pagerduty
  • railsプロジェクトでnew relic

トレタ

  • 昔 : NewRelic, monit
  • 2014/11~: NewRelic, monit, Pingdom, Sensu, munin, PagerDuty
  • 2015/8~: NewRelic, monit, Pingdom, PagerDuty, Mackerel
  • 変遷についてのブログ

ヒトメディア

  • pagerdutyとnewrelicとmuninとsensu。proteus-monitor
  • 今後はdatadogとpagerdutyとnewrelicに?

リブセンス

  • Nagios 日々の設定変更に伴うメンテナンスに苦労している
  • Munin 14系。ほぼ自動設定で動くので運用が楽な一方、台数と利用者が多いため動作にもたつきがある
  • Mackerel+PagerDuty
    • Nagiosに代わってこの組み合わせを採用するメディアが増えてきている。
    • グラフ表示も軽快な上に日々機能が進化しているので期待している。
  • Fluentd + 独自モニタリングツール アプリエラーログを収集してHipChatなどに通知する

メルカリ

  • Zabbix
  • Kurado
  • Mackerel
  • 『zabbixはグラフが見辛いので、グラフ専用のツールとしてkuradoを使ってます。mackerelはnorikraの出力のグラフ化とアラート設定に使ってます』
  • Kibana
  • NewRelic
  • Norikra

Kaizen Platform

  • 情報元。ちょっと古いから変わってるかも
  • Pingdom
  • Sensu
  • Mackerel
  • StatusPage.io
  • PagerDuty

Retty

TreasureData

  • Datadog + Fluentd(カスタムメトリクス) べったり
  • pingdom
  • statuspage.io
  • pagerduty
  • NewRelic

Quipper

  • Pingdom
  • Sentry
  • Datadog
  • NewRelic
  • fluentd+BigQuery+re:dash

グラニ

  • NewRelic
  • CloudWatch -> Librato
  • SLAB(ETW) fluentd的なもの。マイクロソフトのロギングライブラリ
  • ログ分析・可視化に BigQuery、Domo
  • Redis のコマンド実行可視化に Glimpse、MySQL のクエリの調査に JetProfiler

ドワンゴ

  • ブコメより
  • xymon
  • nagios
  • zabbix

pixiv

  • nagios
  • Fluentd, kibana, 独自ビュー。slide
  • pixiv以外のプロジェクトはMackerelとかいろいろ使ってる?

レアジョブ

  • Zabbix
  • Cacti(Zabbixに移行中)
  • MySQL のクエリの調査に JetProfiler
  • 自作の監視シェル(Bash Shell)

Gloops

  • 元情報。古すぎて信ぴょう性薄い
  • icinga
  • pnp4Nagios

これから聞いたり調べたり出来るといいなと思っているところ

  • mixi 知りたいけど知り合いいない
  • LINE 大人の事情で聞けなそう?
  • Freakout どっかに公開されてた気がする
  • その他、情報募集中!