blog

DeNAのエンジニアが考えていることや、担当しているサービスについて情報発信しています

2025.10.20 インターンレポート

キャッチャーのスローイング分析 〜AIで「送球の質」を評価する〜

by Ren Kishimoto

#ai #internship #baystars #data-science

はじめに

AIスペシャリストコースの2025年サマーインターンに、4週間参加させていただいた東京科学大学の岸本です。普段は反実仮想機械学習・マッチングについての研究をしています。

本記事では、私がインターンシップで取り組んだキャッチャーのスローイング分析についてご紹介します。AIを活用してキャッチャー本来の送球能力を評価するスローイングスコアの考案から、その分析結果を直感的に理解するための可視化ツールの開発、そしてスローイングスコアを用いた分析を行いました。

キャッチャーのスローイング評価における課題

近年、プロ野球をはじめとするスポーツ界では、選手のパフォーマンス評価や戦略立案にデータ分析が不可欠となっています。打者の打球速度、投手の球種や回転数など、さまざまなデータが活用され、その可能性が広がっています。横浜DeNAベイスターズの分析チームでは、このような背景から、キャッチャーの能力をAIで多角的に評価する取り組みを進めています。ブロッキング、そして本記事のテーマであるスローイングなど、様々なプレーに関するスコアを独自に算出し、選手育成や戦略立案に活用しています。

従来のキャッチャーの送球能力を測る指標として広く用いられているのが「盗塁阻止率」です。これはキャッチャーの能力を示す重要な指標の一つではありますが、この数値はキャッチャー単独の能力だけでは決まらないという課題を抱えています。盗塁の成否は、キャッチャー自身の能力だけでなく、ピッチャーのクイックモーション、内野手のベースカバー、ランナーのリードの大きさなど、複数の要因が複雑に絡み合って決定されるためです。

このように、盗塁阻止率はキャッチャー以外の多くの要素に影響を受けるため、純粋な「キャッチャーのスローイング能力」を正確に評価することは難しいのが現状です。そこでAIを用いてキャッチャーのスローイングスコアを開発し、分析するという課題に取り組みました。

スローイングスコア算出のアプローチ

キャッチャーの純粋なスローイング能力をAIを用いて評価するため、キャッチャー自身の能力のみに依存する指標を目指しました。

このスローイングスコアでは、キャッチャーの送球能力である「ポップタイム」と「送球位置」の2つの要素で評価します。

キャッチャーのポップタイムと送球位置の説明図

© Natasha Sinegina, Creazilla Licensed under CC BY 4.0, 改変あり

  1. ポップタイム: 捕手が捕球してから、送球がベースを通過するまでの時間(通過したであろう時間)

    ※ ポップタイムは捕手が捕球してから送球するまでの時間である握り変え時間と、捕手が送球してから送球がベースを通過するまでの時間である滞空時間に分解することができます。

  2. スローイングの送球位置: 送球がベースに到達した際の空間的な位置(上下、左右、前後)

これらの要素を組み合わせることで、盗塁阻止の成否という結果に左右されず、キャッチャー個人の送球技術に焦点を当てた評価を行います。

利用データの詳細

分析には主に以下の2種類のデータを利用しました。

  1. スコアブックデータ: 1球単位のスコアブックデータで、盗塁が試みられたか、その成否(盗塁成功、盗塁死など)が記載されています。このデータは信頼性が高く、欠損もほとんどありません。
  2. トラッキングデータ: Hawk-Eyeなどの計測システムから得られるデータで、前述のポップタイムや、送球位置(上下、左右、前後)といった詳細な情報が含まれています。ただし、一部のデータに欠損も存在します。

データ処理と前処理

これらのデータを用いてモデルを構築するにあたり、以下の前処理を行いました。

  • 対象データの限定: 分析の複雑さを軽減し、キャッチャーの純粋な送球能力に焦点を当てるため、一塁ランナー単独の二塁への盗塁に限定して分析対象としました。これにより、他のベースへの送球や複数のランナーが絡むプレイを除外し、条件を統一しました。
  • 外れ値処理: ポップタイムや送球位置に明らかな外れ値(ディレードスチールなどでポップタイムが通常より長いケース)が含まれる場合、それらを欠損値として扱いました。
  • 欠損値: ポップタイム・送球位置の欠損がある場合、特に欠損埋めはせずにそのままモデルの入力として利用します。

スコア算出のロジック概要とモデルの詳細

このスコアでは、前述した捕手の送球能力を示す「ポップタイム」と「送球位置」のデータから「盗塁死」となる確率を予測し、その予測確率に基づいてスコアを算出するアプローチを採用しました。

LightGBMを用いたスローイングスコア算出手法

モデルには、勾配ブースティング決定木の一種であるLightGBMを採用しました。データは一軍・二軍がありますが、一軍に合わせるために、trainデータには一軍データのみ(約7000件)の盗塁試行データを利用しました。交差検証(今回はフォールド数=3)を用い、学習と予測のデータセットで同じキャッチャーが重複していても問題ないと判断し、train/testデータの分け方は工夫していません。

入力特徴量としては、送球位置(上下、左右、前後)、ポップタイム、暴投フラグを用い、これらから盗塁死になる確率を予測しました。暴投フラグはキャッチャーの送球が暴投してランナーが次の塁に進塁してしまった場合のフラグです。この予測確率が、キャッチャーの純粋なスローイング能力を示す「スローイングスコア」となります。 さらに、送球位置のデータのみからLightGBMを用いてコントロールスコアを算出し、送球の正確性のみに特化した評価も行いました。

このアプローチにより、各キャッチャーのスローイング能力が数値として可視化され、比較・分析が可能になります。

分析可視化ツールの開発

作成したスローイングスコアを利用した分析に入る前に、分析用に作成した可視化ツールを紹介します。

選手特徴分析

選手特徴分析の散布図

各キャッチャーの特性を相対的に把握するツールです。スローイングスコア、コントロールスコア、盗塁阻止率、ポップタイム、暴投率などの指標を、横軸・縦軸に自由に設定して各選手をプロットできます。

各選手ページ:送球位置プロット

二塁ベース周辺の送球位置プロット

実際の送球位置を二塁ベース周辺にプロットし、視覚的に送球のばらつきや傾向を把握できます。プロットされた個々の点(送球)をクリックすることで、その送球に関する詳細な投球情報やキャッチャー指標を確認できます。

スローイングの分析結果

作成したスローイングスコアと可視化ツールを利用して、様々な角度からキャッチャーのスローイングを分析しました。

スローイングスコアの確認

まずは作成したスローイングスコアと従来の盗塁阻止率の関係を確認してみます。

スローイングスコアと盗塁阻止率の相関関係

横軸にスローイングスコア・縦軸に盗塁阻止率として、各選手をプロットしています。 このスローイングスコアは、既存の盗塁阻止率と相関係数0.41と相関関係がある一方で、盗塁阻止率が低くてもスローイングスコアが高い選手も存在することが明らかになりました。これは、捕手単独の能力を評価するスローイングスコアが、盗塁阻止率では見えなかった選手の潜在能力を浮き彫りにする可能性を示しています。

具体例として、良いスローイングと悪いスローイングの差がどのようにスコアに現れるかをご紹介します。

良いスローイングスコア例

スローイングスコアが高い例

上の画像は、非常に良いスローイングをした場面です。この時のスローイングスコアは65点(=0.65)と高く、コントロールスコアは0.67、ポップタイムは2.1秒を記録しています。平均的なスローイングスコアは30点程度なので、これは非常に高いスコアと言えます。

悪いスローイングスコア例

スローイングスコアが低い例

対照的に、こちらの画像は、スローイングスコアが15点(=0.15)と低いケースです。コントロールスコアは0.19で、ポップタイムは2.0秒となっています。送球位置が三塁側に外れてしまっており、スローイングスコアが低下してしまっていることが分かります。

このように、スローイングスコアは、盗塁の結果でなく、送球の「質」に着目してキャッチャーの能力を評価できるスコアです。

スローイングスコアにおけるコントロールの重要性

キャッチャーのスローイング能力を評価する上で、一般的に「強肩であること」や「ポップタイムが短いこと」が重要視されがちです。もちろんポップタイムは重要な要素ですが、今回の分析を通じて、LightGBMの特徴量重要度を確認してみると、スローイングスコアにおいて「コントロール(送球位置)」も非常に大きな影響を与えることが明らかになりました。

どれだけポップタイムが速くても、送球が目標地点から逸れてしまうと、ボールを捕球してからタッチするまでに余計な時間を要したり、無理な体勢でのタッチを強いられたりします。これにより、結果的にタッチまでの時間が増加し、盗塁阻止の成功率が低下してしまいます。つまり、速いボールでも正確性を欠けば、そのアドバンテージは相殺されてしまう可能性が高いのです。

送球位置別のスローイングスコア

前節で、キャッチャーのスローイングにおいてコントロールが非常に重要であることを述べました。ではスローイングスコアが高くなる送球位置はどこなのでしょうか? この点を明らかにするために、送球位置とスローイングスコアの関係を詳しく分析しました。

送球位置別のスローイングスコア分析

上記の図は、二塁ベース上の送球位置とスローイングスコアの関係を可視化したものです。赤いプロットはスローイングスコアが高い良い送球を、青いプロットはスコアが低い悪い送球を示しており、黒い線は二塁ベースを表しています。

この図から、以下の傾向が明確に読み取れます。

  • 高さ1.6m程度までの送球:送球の高さは、野手がタッチしやすい約1.6m程度までがスコアが高い傾向にあります。
  • 三塁側と一塁側の差三塁側への送球よりも一塁側への送球の方が、全体的にスローイングスコアが高い傾向にあることが分かりました。これは、ランナーが一塁側から来るため、ランナーにタッチしやすい範囲が一塁側にあることを示しています。
  • ショートバウンドの影響:縦軸の0mよりも低い部分はほとんどが青色になっており、ショートバウンドになった送球は、高い確率でスローイングスコアが低いという結果も現れました。ショートバウンドはボールが捕球しにくく、またランナーへのタッチのしづらさが原因だと考えられます。

つまり、送球で狙うべきは、ベースの中心を基準として、赤枠で囲った横-0.6m~1.7m、縦-0.1m~1.6mのゾーンであることが判明しました。

球種がスローイングスコアに与える影響

さらに分析を進めると、ピッチャーが投じる球種によってもキャッチャーのスローイングパフォーマンスに影響があることが見えてきました。特に、速球(ストレート、ツーシーム、シュート)と落ち球(フォーク、チェンジアップ、シンカー)に分類される球種を比較すると、以下の傾向が明らかになりました。

球種別スローイングスコアの比較 球種別暴投率の比較 球種別ポップタイムの内訳分析

落ち球が投じられた場合、キャッチャーのスローイングスコアは速球時と比較して低下する傾向が見られました。これは暴投率の悪化とポップタイムの悪化が影響を与えています。さらに、ポップタイムの悪化は滞空時間ではなく、握り変え時間の悪化によるものであることがわかります。これは、落ち球が低めのコースに投じられることが多く、キャッチャーが捕球後の握り変えに時間を要するためと考えられます。

ベースカバーする野手のポジションがスローイングスコアに与える影響

二塁への送球は、ショートまたはセカンドのいずれかがベースカバーに入ります。このベースカバーのポジションによっても、キャッチャーのスローイングスコアに特徴的な傾向があることが判明しました。

ベースカバーポジション別スローイングスコア比較

具体的には、ショートがベースに入る場合は三塁側寄りの送球で、セカンドがベースに入る場合は一塁側寄りの送球でスローイングスコアが高くなる傾向が見られました。これは、各ポジションの選手にとって自然に捕球し、タッチしやすい位置であるためです。 また、セカンドがベースに入る場合と比較して、ショートがベースに入る場合の方が、スローイングスコアが高くなる送球範囲が広いという結果が得られました。これは、ショートがベースカバーに入る際の動きの流れでタッチしやすい体勢を取れるため、キャッチャーの送球が多少ずれてもカバーしやすいという状況が影響している可能性があります。

ベースカバーのポジションと左右打者別の影響

さらに詳細な分析として、ベースカバーのポジションと打席に立つ打者の左右の組み合わせによってもスローイングスコアに変化があるか検証しました。

打者位置とベースカバー別スローイング分析

その結果、左打者が打席に立ち、セカンドがベースカバーに入るケースは非常に珍しい状況ですが、このような場面では、キャッチャーのスローイングスコアが大きく低下することが分かりました。スローイングスコアの低下は、コントロールスコアや暴投率の悪化が原因となっています。この要因の断定は難しいですが、左打者が打席に立つことで、キャッチャーから見てベースカバーに入るセカンドやランナーが打者の陰になり、視界が制限されることが一因として挙げられます。これにより、正確な送球コースが定めにくくなり、結果として暴投が増加したり、コントロールが悪化したりする可能性が考えられそうです。

まとめ

今回はキャッチャーのみの能力を評価するスローイングスコアを作成し、スローイングの分析を行いました。結果として、盗塁を阻止するためには、ポップタイムだけではなくコントロールの方も重要であるということと、最適な送球位置(ベース中心から横-0.6m~1.7m、縦-0.1m~1.6m)を明らかにしました。

本インターンで作成したスローイングスコアや分析結果の活用方法としては、以下のようなものを想定しています。

  • 送球練習をする上での目安の作成や、各キャッチャーの傾向や苦手部分を詳細に把握し、スローイングを改善する
  • 相手チームのキャッチャーを分析し、その弱点や特徴を狙った盗塁戦略を立てる
  • スローイングスコアと盗塁阻止率の違いから、ピッチャーのクイックや内野手のタッチ能力など、チーム全体の課題を発見する

更に、将来的にトラッキング精度の向上によって欠損データが減れば、より精度の高い分析を行う事ができます。

おわりに

今回の分析を通じて、キャッチャーのスローイング一つをとってみても考えるべきことが非常に多いことを実感しました。自分自身が野球をプレーしたり観戦したりしている時に漠然と考えてはいたものの、深く掘り下げていなかった要素を探求できて大変面白い経験でした。スポーツのデータ分析は初めての取り組みでしたが、データの観点からスポーツに向き合い、貢献する楽しさを知ることができました。

メンターの大矢さん・大西さんには、実用性を意識した分析手法や、結果を直感的に伝えるための可視化方法について、多くの知見と丁寧なフィードバックをいただきました。

また、多くの社員の皆様と交流させていただき、DeNAにおける技術の多様性や、挑戦を歓迎するオープンなカルチャーを肌で感じることができました。このような貴重な機会をいただき、ありがとうございました。

最後まで読んでいただき、ありがとうございます!
この記事をシェアしていただける方はこちらからお願いします。

recruit

DeNAでは、失敗を恐れず常に挑戦し続けるエンジニアを募集しています。